Sei sulla pagina 1di 9

PREDECIR Y MOSTRAR TENDENCIAS EN GRFICOS

Las lneas de tendencia se usan para mostrar grficamente las tendencias de los datos y analizar los
problemas de prediccin. Este anlisis tambin se denomina anlisis de regresin: forma de anlisis estadstico
utilizada para pronsticos. El anlisis de regresin calcula la relacin entre variables, de modo que puede
predecirse una variable a partir de otra (u otras variables).). Mediante el uso del anlisis de regresin, puede
representarse una lnea de tendencia en un grfico ms all de los datos reales para predecir los valores
futuros.
Media mvil. Tambin se puede crear una media mvil: secuencia de medias calculadas a partir de porciones
de una serie de datos. En un grfico, una media mvil suaviza las fluctuaciones en los datos, mostrando as
con ms claridad la trama o tendencia.), que suaviza las fluctuaciones de los datos y muestra la trama o la
tendencia con ms claridad.
Tipos de grficos que admiten lneas de tendencia. Pueden agregarse lneas de tendencia a las series de
datos (puntos de datos relacionados que se trazan en un grfico. Cada serie de datos de un grfico tiene una
trama o color exclusivo y se representa en la leyenda del grfico. Puede trazar una o ms series de datos en un
grfico. Los grficos circulares slo tienen una serie de datos) en los grficos de reas 2D no apiladas, de
barras, de columnas, de lneas, de cotizaciones, de tipo XY (Dispersin) y de burbujas. No pueden agregarse
lneas de tendencia a las series de datos en los grficos 3D, apilados, radiales, circulares, de superficie o de
anillos. Si se cambia un grfico o una serie de datos de modo que ya no permita la lnea de tendencia asociada
(por ejemplo, si se cambia el tipo de grfico por un grfico de reas 3D o si se cambia la vista de un informe de
grfico dinmico (grfico que proporciona anlisis de datos interactivo, como un informe de tabla dinmica.
Puede cambiar las vistas de los datos, ver niveles de detalle diferentes o reorganizar el diseo del grfico
arrastrando campos y mostrando u ocultando elementos de los mismos.) o de un informe de tabla dinmica
asociado (informe de tabla dinmica que proporciona los datos de origen a un informe de grfico dinmico. Se
crea automticamente cuando se crea un nuevo informe de grfico dinmico. Cuando se cambia el diseo de
alguno de los informes, el otro cambia tambin.)), se perdern las lneas de tendencia.
Tipos de lneas de tendencia: elegir el adecuado para los datos
Cuando desee agregar una lnea de tendencia a un grfico en Microsoft Excel, puede elegir uno de los seis
tipos diferentes de tendencia o regresin. El tipo de datos de que disponga determina el tipo de lnea de
tendencia que debe utilizar.
Lineal
Una lnea de tendencia lineal es una lnea recta que se ajusta perfectamente y que se utiliza con
conjuntos de datos lineales simples. Los datos son lineales si la trama de los puntos de datos se
parece a una lnea. Una lnea de tendencia lineal normalmente muestra que algo aumenta o disminuye
a un ritmo constante.
Logartmica
Una lnea de tendencia logartmica es una lnea curva que se ajusta perfectamente y que se utiliza
cuando el ndice de cambios de los datos aumenta o disminuye rpidamente y despus se estabiliza.
Esta lnea de tendencia logartmica puede utilizar valores positivos o negativos.
Polinmica
Una lnea de tendencia polinmica es una lnea curva que se utiliza cuando los datos fluctan. Es til,
por ejemplo, para analizar las prdidas y ganancias de un conjunto de datos grande. El orden del
polinomio se puede determinar mediante el nmero de fluctuaciones en los datos o en funcin del
nmero de mximos y mnimos que aparecen en la curva. Una lnea de tendencia polinmica de Orden
2 suele tener slo un mximo o un mnimo. Una de Orden 3 normalmente tiene uno o dos mximos o
mnimos. El Orden 4 tiene hasta tres.
Potencial
Una lnea de tendencia de potencia es una lnea curva utilizada con conjuntos de datos que comparan
medidas que aumentan a un ritmo concreto; por ejemplo, la aceleracin de un automvil de carreras a
intervalos de un segundo. No es posible crear una lnea de tendencia de potencia si los datos contienen
valores cero o negativos.
Exponencial
Una lnea de tendencia exponencial es una lnea curva que se utiliza cuando los valores de los datos
aumentan o disminuyen a intervalos cada vez mayores. No es posible crear una lnea de tendencia
exponencial si los datos contienen valores cero o negativos.

HERRAMIENTAS DE ANLISIS ESTADSTICO


Varianza
Las herramientas de anlisis de varianza proporcionan distintos tipos de anlisis de la varianza. La herramienta
que vaya a usarse depender del nmero de factores y del nmero de muestras que tenga de la poblacin que
desee comprobar.
Varianza de un factor Esta herramienta realiza un anlisis simple de varianza en los datos de dos o ms
muestras. El anlisis proporciona una prueba de la hiptesis de que cada muestra se extrae de la misma
distribucin subyacente de probabilidades frente a la hiptesis alternativa de que las distribuciones
subyacentes de probabilidades no son las mismas para todas las muestras. Si slo existieran dos muestras, la
funcin de la hoja de clculo, PRUEBA.T podra utilizarse igualmente. Con ms de dos muestras, PRUEBA.T
no es de uso generalizado y en su lugar se puede llamar al modelo Varianza de un factor.
Varianza de dos factores con varias muestras por grupo Esta herramienta de anlisis es til cuando los
datos se pueden clasificar de acuerdo con dos dimensiones diferentes. Por ejemplo, en un experimento para
medir el alto de las plantas, las plantas pueden recibir diferentes marcas de fertilizante (por ejemplo, A, B o C) y
tambin estar a temperaturas distintas (por ejemplo, alta o baja). Para cada uno de los 6 pares {fertilizante,
temperatura} posibles, tenemos un nmero igual de observaciones de alto de la planta. Con esta herramienta
podemos comprobar:
1. Si el alto de las plantas para las diferentes marcas de fertilizante se
extrae de la misma poblacin subyacente; las temperaturas no se
tienen en cuenta en este anlisis.
2. Si el alto de las plantas para las diferentes temperaturas se extrae de la
misma poblacin subyacente; las marcas de fertilizante no se tienen en
cuenta en este anlisis.
3. Si habiendo tenido en cuenta los efectos de las diferentes marcas de
fertilizante del paso 1 y las diferencias de temperatura del paso 2, las 6
muestras que representan todos los pares de valores {fertilizante,
temperatura} se extraen de la misma poblacin. La hiptesis alternativa
es que se produzcan efectos debidos a pares {fertilizante, temperatura}
especficos ms all de las diferencias basadas slo en el fertilizante o
slo en la temperatura.
Varianza de dos factores con una sola muestra por grupo Esta herramienta de anlisis es til cuando los
datos se clasifican en dos dimensiones diferentes, como en el caso de la varianza de dos factores con varias
muestras por grupo. No obstante, con esta herramienta suponemos que existe una nica observacin para
cada par; por ejemplo, cada uno de los pares {fertilizante, temperatura} del ejemplo anterior. Mediante esta
herramienta podemos aplicar las pruebas de los pasos 1 y 2 del caso Varianza de dos factores con varias
muestras por grupo, pero no tenemos datos suficientes para aplicar la prueba del paso 3.
Correlacin
Las funciones COEF.DE.CORREL y PEARSON de la hoja de clculo calculan el coeficiente de correlacin
entre dos variables de medida cuando se observan medidas de cada variable para cada uno de los N sujetos.
(Cualquier observacin que falte de cualquier sujeto har que dicho sujeto se omita del anlisis.) La
herramienta de anlisis Correlacin es especialmente til cuando existen ms de dos variables de medida para
cada uno de los N sujetos. Proporciona una tabla de resultados, una matriz de correlacin que muestra el valor
de COEF.DE.CORREL (o PEARSON) aplicado a cada uno de los pares de variables de medida posibles.
El coeficiente de correlacin, como la covarianza, es una medida del grado en el que dos variables de medida
pueden variar juntas. A diferencia de la covarianza, el coeficiente de correlacin se escala para que su valor
sea independiente de las unidades en las que se expresen las dos variables de medida (por ejemplo, si las dos
variables de medida son peso y alto, el valor del coeficiente de correlacin no cambia si el peso se convierte de
libras a kilos). El valor de cualquier coeficiente de correlacin debe encontrarse entre -1 y +1, ambos inclusive.
Puede utilizar la herramienta de anlisis de correlacin para examinar cada uno de los pares de variables de
medida a fin de determinar si las dos variables de medida tienden a variar conjuntamente, es decir, si los
valores altos de una variable tienden a estar asociados con los valores altos de la otra (correlacin positiva), si
los valores bajos de una variable tienden a estar asociados con los valores bajos de la otra (correlacin
negativa) o si los valores de ambas variables tienden a no estar relacionados (correlacin con tendencia a
cero).
Covarianza
Las herramientas Correlacin y Covarianza pueden utilizarse con la misma configuracin cuando se han
observado N variables de medida diferentes en un grupo de individuos. Cada una de las herramientas
Correlacin y Covarianza proporciona una tabla de resultados, una matriz que muestra el coeficiente de
correlacin o covarianza, respectivamente, entre cada par de variables de medida. La diferencia es que los
coeficientes de correlacin estn comprendidos entre -1 y +1, ambos inclusive, y las covarianzas
correspondientes no se escalan. Tanto el coeficiente de correlacin como la covarianza son medidas del grado
en el que dos variables varan juntas.

La herramienta Covarianza calcula el valor de la funcin COVAR de la hoja de clculo para cada uno de los
pares de variables de medida. (Usar COVAR directamente en lugar de la herramienta Covarianza es una
alternativa razonable cuando slo hay dos variables de medida, es decir, N=2.) La entrada de la diagonal de la
tabla de resultados de la herramienta Covarianza en la fila i, columna i es la covarianza de la variable de
medida i consigo misma; se trata de la varianza de la poblacin para dicha variable calculada mediante la
funcin VARP de la hoja de clculo.
Puede utilizar la herramienta de covarianza para examinar cada par de variables de medida a fin de determinar
si las dos variables de medida tienden a variar conjuntamente, es decir, si los valores altos de una variable
tienden a estar asociados con los valores altos de la otra (covarianza positiva), si los valores bajos de una
variable tienden a estar asociados con los valores bajos de la otra (covarianza negativa) o si los valores de
ambas variables tienden a no estar relacionados (covarianza con tendencia a cero).
Estadstica descriptiva
La herramienta de anlisis Estadstica descriptiva genera un informe estadstico de una sola variable para los
datos del rango de entrada, y proporciona informacin acerca de la tendencia central y dispersin de los datos.
Prueba t para varianzas de dos muestras
La herramienta de anlisis Prueba t para varianzas de dos muestras ejecuta una Prueba t de dos muestras
para comparar dos varianzas de poblacin.
Por ejemplo, puede utilizar la herramienta Prueba t con muestras de los tiempos realizados por cada uno de los
dos equipos de una competicin de natacin. La herramienta proporciona el resultado de la hiptesis nula de
que estas dos muestras provengan de distribuciones con varianzas iguales frente a la alternativa de que las
varianzas no sean iguales en las distribuciones subyacentes.
La herramienta calcula el valor f de una estadstica F (o proporcin F). Un valor de f cercano a 1 proporciona
pruebas de que las varianzas de poblacin subyacentes son iguales. En la tabla de resultados, si f < 1, P(F <=
f) de una cola da la probabilidad de observar un valor de la estadstica F menor que f cuando las varianzas de
poblacin son iguales y Valor crtico de F de una cola da el valor crtico menor que 1 para el nivel de
importancia elegido, Alpha. Si f > 1, P(F <= f) de una cola da la probabilidad de observar un valor de la
estadstica F superior a f cuando las varianzas de poblacin son iguales y Valor crtico de F de una cola da el
valor crtico mayor que 1 para Alpha.
Regresin
La herramienta de anlisis Regresin realiza un anlisis de regresin lineal utilizando el mtodo de los
"mnimos cuadrados" para ajustar una lnea a una serie de observaciones. Puede utilizar esta herramienta para
analizar la forma en que los valores de una o ms variables independientes afectan a una variable
dependiente.
Por ejemplo, puede analizar de qu modo inciden en el rendimiento de un atleta varios factores: la edad, la
estatura y el peso. Basndose en un conjunto de datos de rendimiento, la regresin determinar la incidencia
de cada uno de los factores en la medicin del rendimiento y podrn utilizarse estos resultados para predecir el
rendimiento de un atleta nuevo no sometido a ninguna prueba.
La herramienta Regresin utiliza la funcin ESTIMACION.LINEAL de la hoja de clculo.
Muestreo
La herramienta de anlisis Muestreo crea una muestra de poblacin tratando el rango de entrada como una
poblacin. Cuando la poblacin sea demasiado grande para procesarla o para presentarla grficamente, puede
utilizarse una muestra representativa. Adems, si cree que los datos de entrada son peridicos, puede crear
una muestra que contenga nicamente los valores de una parte determinada de un ciclo.
Por ejemplo, si el rango de entrada contiene cifras de ventas trimestrales, la muestra realizada con una tasa
peridica de cuatro, permitir colocar los valores del mismo trimestre en la tabla de resultados.
Prueba t
Las herramientas de anlisis Prueba t de dos muestras permiten comprobar la igualdad de las medias de
poblacin subyacentes a cada muestra. Las tres herramientas utilizan diferentes suposiciones: que las
varianzas de poblacin son iguales, que las varianzas de poblacin no son iguales y que las dos muestras
representan observaciones anteriores y posteriores al tratamiento en los mismos sujetos.
Para las tres herramientas que figuran a continuacin, un valor de la estadstica T, t, se calcula y se muestra
como t Stat en las tablas de resultados. Dependiendo de los datos, este valor t puede ser negativo o no
negativo. Suponiendo medias de poblacin subyacentes iguales, si t < 0, P(T <= t) de una cola da la
probabilidad de que se observe un valor de la estadstica T que sea ms negativo que t. Si t >=0, P(T <= t) de
una cola da la probabilidad de que se observe un valor de la estadstica T que sea ms positivo que t. Valor
crtico t de una cola da el valor de corte para que la probabilidad de observar un valor de la estadstica t mayor
o igual a Valor crtico t de una cola sea Alpha.
P(T <= t) de dos colas da la probabilidad de que se observe un valor de la estadstica T que sea mayor en
valor absoluto que t. Valor crtico P de dos colas da el valor de corte para que la probabilidad de una
estadstica T observada mayor en valor absoluto que Valor crtico P de dos colas sea Alpha.

Prueba t para dos muestras suponiendo varianzas iguales


Esta herramienta de anlisis ejecuta una
prueba t de Student en dos muestras. En este tipo de prueba se supone que los dos conjuntos de datos
proceden de distribuciones con las mismas varianzas. Se conoce con el nombre de prueba t homoscedstica.
Puede utilizar este tipo de prueba para determinar si es probable que las dos muestras procedan de
distribuciones con medias de poblacin iguales.
Prueba t para dos muestras suponiendo varianzas desiguales Esta herramienta de anlisis ejecuta una
prueba t de Student en dos muestras. En este tipo de prueba se supone que los dos conjuntos de datos
proceden de distribuciones con varianzas desiguales. Se conoce con el nombre de prueba t heteroscedstica.
Al igual que en el caso anterior, este tipo de prueba puede utilizarse para determinar si es probable que las dos
muestras procedan de distribuciones con medias de poblacin iguales. Utilice esta prueba cuando haya sujetos
distintos en las dos muestras. Utilice la prueba emparejada, que se describe ms abajo, cuando exista un
conjunto nico de sujetos y las dos muestras representen las medidas de cada uno de los sujetos antes y
despus de un tratamiento.
La siguiente frmula se utiliza para determinar el valor estadstico t.

La siguiente frmula se utiliza para calcular los grados de libertad (grados_de_libertad). Puesto que el resultado
del clculo normalmente no es un entero, el valor de los grados de libertad se redondea al entero ms prximo
para obtener un valor crtico de la tabla t. La funcin PRUEBA.T de la hoja de clculo de Excel utiliza el valor
calculado de los grados de libertad sin redondeos ya que es posible calcular un valor para PRUEBA.T con un
valor de grados de libertad no entero. A causa de estos diferentes mtodos para determinar los grados de
libertad, los resultados de PRUEBA.T y esta herramienta de prueba t variarn en el caso de varianzas
desiguales.

Prueba t para medias de dos muestras emparejadas Puede utilizar una prueba emparejada cuando existe
un par natural de observaciones en las muestras, como cuando un grupo de muestras se somete a prueba dos
veces, antes y despus de un experimento. Esta herramienta de anlisis y su frmula ejecutan una prueba t de
Student de dos muestras emparejadas para determinar si las observaciones realizadas antes y despus de un
tratamiento proceden de distribuciones con medias de poblacin iguales. En este tipo de prueba no se supone
que las varianzas de ambas poblaciones sean iguales.
Nota Entre los resultados generados mediante esta herramienta se encuentra la varianza agrupada, una
medicin acumulada de la distribucin de datos acerca de la media, derivada de la frmula siguiente.

Prueba z
La herramienta de anlisis Prueba z para medias de dos muestras realiza una prueba z en las medias de dos
muestras con varianzas conocidas. Esta herramienta se utiliza para comprobar las hiptesis nulas relativas a
que no existen diferencias entre dos medias de poblacin frente a las hiptesis alternativas en uno u otro
sentido. Si no se conocen las varianzas, deber utilizarse la funcin PRUEBA.Z de la hoja de clculo.
Cuando se utiliza la herramienta de prueba z, hay que tener especial cuidado en comprender el resultado. P(Z
<= z) de una cola es en realidad P(Z >= ABS(z)), la probabilidad de un valor z ms all de 0 en la misma
direccin que el valor z observado cuando no hay diferencias entre las medias de poblacin. P(Z <= z) de dos
colas es realmente P(Z >= ABS(z) o Z <= -ABS(z)), la probabilidad de un valor z ms all de 0 en cualquier
direccin que el valor z observado cuando no hay diferencias entre las medias de poblacin. El resultado de
dos colas es el resultado de una cola multiplicado por 2. La herramienta de prueba z tambin puede utilizarse
para el caso en que la hiptesis nula sea que existe un valor distinto de cero especfico para la diferencia entre
las dos medias de poblacin.
Por ejemplo, puede utilizarse esta prueba para determinar las diferencias entre el rendimiento de dos modelos
de automvil.

PRONOSTICO
Calcula o pronostica un valor futuro a travs de los valores existentes. La prediccin del valor es un valor y
teniendo en cuenta un valor x. Los valores conocidos son valores x y valores y existentes, y el nuevo valor se
pronostica utilizando regresin lineal. Esta funcin se puede utilizar para realizar previsiones de ventas,
establecer requisitos de inventario o tendencias de los consumidores.
Sintaxis
PRONOSTICO(x;conocido_y;conocido_x)
X es el punto de datos cuyo valor desea predecir.
Conocido_y es la matriz o rango de datos dependientes.
Conocido_x es la matriz o rango de datos independientes.
Observaciones
Si x no es numrico, PRONOSTICO devuelve el valor de error #VALOR!
Si no se ha especificado ningn valor para conocido_y o conocido_x, o si contienen un nmero
diferente de puntos de datos, PRONOSTICO devuelve el valor de error #N/A.
Si la varianza de conocido_x es igual a cero, PRONOSTICO devuelve el valor de error #DIV/0!
La ecuacin de la funcin PRONOSTICO es a + bx, donde:

y donde x e y son las medias de muestra PROMEDIO(conocido_x) y PROMEDIO(conocido y).


Ejemplo
A
Y conocido
1 6
2 7
3 9
4 15
5 21
6 Frmula
=PRONOSTICO(30;A2:A6;B2:B6)

B
X conocido
20
28
31
38
40
Descripcin (Resultado)
Predice un valor para y dado un valor de 30 para x (10,60725)

ESTIMACION.LINEAL
Calcula las estadsticas de una lnea utilizando el mtodo de "mnimos de cuadrados" para calcular la lnea
recta que mejor se ajuste a los datos y devuelve una matriz que describe la lnea. Debido a que esta funcin
devuelve una matriz de valores, debe ser introducida como una frmula de matrices.
La ecuacin para la lnea es:
y = mx + b o
y = m1x1 + m2x2 + ... + b (si hay varios rangos de valores X)
donde el valor Y dependiente es funcin de los valores X independientes. Los valores m son coeficientes que
corresponden a cada valor X, y b es un valor constante. Observe que Y, X y m pueden ser vectores. La matriz
que devuelve ESTIMACION.LINEAL es {mn,mn-1,...,m1,b}. ESTIMACION.LINEAL tambin puede devolver
estadsticas de regresin adicionales.
Sintaxis
ESTIMACION.LINEAL(conocido_y,conocido_x,constante,estadstica)
Conocido_y - es el conjunto de valores de y que se conocen en la relacin y = mx+b.
Si la matriz definida por el argumento conocido_y ocupa una sola columna, cada columna de
conocido_x se interpreta como una variable separada.
Si la matriz definida por el argumento conocido_y ocupa una sola fila, cada fila de conocido_x se
interpreta como una variable separada.
Conocido_x - es un conjunto opcional de valores x en la relacin y = mx+b.
La matriz definida por el argumento conocido_x puede incluir uno o varios conjuntos de variables. Si se
usa una sola variable, conocido_y y conocido_x pueden ser rangos con cualquier forma, siempre y
cuando sus dimensiones sean iguales. Si se usa ms de una variable, conocido_y tiene que ser un
vector (es decir, un rango compuesto por una fila o por una columna).
Si se omite conocido_x, se asume que sta es la matriz {1;2;3;...} que tiene el mismo tamao que
conocido_y.
Constante - es un valor lgico que especifica si se ha de forzar a la constante b a ser igual a 0.

Si el argumento constante es VERDADERO o se omite, b se calcula normalmente.


Si constante es FALSO, b se establece como igual a 0 y los valores m se ajustan para encajar en y =
mx.
Estadstica - es un valor lgico que especifica si se debern devolver estadsticas de regresin adicionales.
Si estadstica es VERDADERO, ESTIMACION.LINEAL devuelve las estadsticas de regresin
adicionales,
de
forma
que
la
matriz
devuelta
es
{mn,mn-1,...,m1,b;sen,sen1,...,se1,seb;r2,sey;F,df;ssreg,ssresid}.
Si estadstica es FALSO o se omite, ESTIMACION.LINEAL slo devuelve los coeficientes m y la
constante b.
Las estadsticas de regresin adicional son las que se indican a continuacin.
Estadstica
Descripcin
se1,se2,...,sen Los valores de error estndar para los coeficientes m1,m2,...,mn.
seb
El valor de error estndar para la constante b (seb = #N/A cuando constante es FALSO).
r2
El coeficiente de determinacin. Compara los valores y estimados y reales, y los rangos con
valor de 0 a 1. Si es 1, hay una correlacin perfecta en la muestra, es decir, no hay diferencia
entre el valor y estimado y el valor y real. En el otro extremo, si el coeficiente de determinacin
es 0, la ecuacin de regresin no es til para predecir un valor y. Para obtener informacin
sobre el clculo de r2, consulte la seccin de "Comentarios" ms adelante en este mismo
tema.
sey
El error estndar para la estimacin y.
F
La estadstica F o valor F observado. Utilice la estadstica F para determinar si la relacin
observada entre las variables dependientes e independientes se produce por azar.
df
Grados de libertad. Utilice los grados de libertad para encontrar valores F crticos en una tabla
estadstica. Compare los valores que encuentre en la tabla con la estadstica F devuelta por
ESTIMACION.LINEAL para determinar un nivel de confianza para el modelo. Para obtener
informacin sobre el clculo de df, consulte el apartado "Observaciones" ms adelante en este
mismo tema. El ejemplo 4 muestra el uso de F y df.
ssreg
La suma de regresin de los cuadrados.
ssresid
La suma residual de los cuadrados. Para obtener informacin sobre el clculo de ssreg y
ssresid, consulte la seccin "Observaciones" ms adelante en este mismo tema.
La ilustracin siguiente muestra el orden en que se devuelven las estadsticas de regresin adicionales.

Observaciones
La exactitud de la lnea calculada por ESTIMACION.LINEAL depende del grado de dispersin de los
datos. Cuanto ms lineales sean los datos, ms exacto ser el modelo ESTIMACION.LINEAL.
ESTIMACION.LINEAL utiliza el mtodo de mnimos de los cuadrados para determinar el mejor ajuste
para los datos. Si slo tiene una variable X dependiente, los clculos para m y b se basan en las
frmulas siguientes:

donde x e y son medias de muestras, es decir, x = PROMEDIO(conocido_x) e y =


PROMEDIO(conocido_y).
En el anlisis de regresin, Microsoft Excel calcula para cada punto el cuadrado de la diferencia entre
el valor Y estimado para ese punto y su valor Y real. La suma de estas diferencias cuadradas se
denomina suma de los cuadrados residual, ssresid. Microsoft Excel calcula a continuacin la suma total
de los cuadrados, sstotal. Cuando const=VERDADERO, o se omite, la suma total de los cuadrados es
la suma de las diferencias al cuadrado entre los valores Y reales y la media de los mismos. Cuando
const=FALSO, la suma total de los cuadrados es la suma de los cuadrados de los valores Y reales (sin
restar el valor Y medio de cada valor Y individual). La suma de regresin de los cuadrados, ssreg,
puede hallarse a partir de ssreg = sstotal - ssresid). Cuanto menor sea la suma residual de los
cuadrados, en comparacin con la suma total de los cuadrados, mayor ser el valor del coeficiente de

determinacin, r2, que es un indicador de hasta qu punto la ecuacin resultante del anlisis de
regresin explica la relacin entre las variables. r2 es igual a ssreg/sstotal.
df se calcula de la siguiente manera cuando no se elimina ninguna columna X del modelo debido a la
colinealidad: si hay k columnas de conocido_x y const = VERDADERO u omitida, entonces df = n k
1. Si const = FALSO, entonces df = n - k. En ambos casos, cada columna X eliminada debido a la
colinealidad aumenta df en 1.

Ejemplo 1 Regresin lineal simple


Mes
1 1
2 2
3
3
4
4
5
5 6
6 Frmula
7 =SUMA(ESTIMACION.LINEAL(B2:B7, A2:A7)*{9,1})

Ventas
3100
4500
4400
5400
7500
8100
Descripcin (Resultado)
Calcula las ventas del noveno mes (11000)

Ejemplo 2. Regresin lineal mltiple


Suponga que un programador comercial est pensando en adquirir un grupo de pequeos edificios de oficinas
en un distrito comercial conocido.
El programador puede utilizar el anlisis de regresin lineal mltiple para estimar el valor de un edificio de
oficinas en un rea determinada basndose en las variables siguientes.
Variable Indica
y
Valor tasado del edificio de oficinas
x1
Superficie en metros cuadrados
x2
Nmero de oficinas
x3
Nmero de entradas
x4
Antigedad del edificio en aos
Este ejemplo supone que existe una relacin de lnea recta entre cada variable independiente (x1, x2, x3, y x4)
y la variable dependiente (y), el valor de los edificios de oficinas en esa rea.
El programador elige al azar una muestra de 11 edificios de oficinas de 1.500 edificios posibles y obtiene los
datos siguientes. "Media entrada" significa una entrada slo para entregas.
El ejemplo puede resultar ms fcil si lo copia en una hoja de clculo en blanco.
A
Superficie (x1)
2310
2333
2356
2379
2402
2425
2448
2471
2494
2517
2540
Frmula
=ESTIMACION.LINEAL(E2:E12,A2:D12,VERDADERO,VERDADERO)

B
Oficinas (x2)
2
2
3
3
2
4
2
2
3
4
2

C
Entradas (x3)
2
2
1,5
2
3
2
1,5
2
3
4
3

D
Antigedad (x4)
20
12
33
43
53
23
99
34
23
55
22

E
Valor tasado (y)
142.000
144.000
151.000
150.000
139.000
169.000
126.000
142.900
163.000
169.000
149.000

Nota La frmula del ejemplo debe escribirse como frmula matricial. Despus de copiar el ejemplo en una hoja
de clculo en blanco, seleccione el rango A14:E18 a partir de la celda de frmula. Presione F2 y, a
continuacin, CTRL+MAYS+ENTRAR. Si la frmula no se introduce en formato matricial, el resultado sencillo
es -234,2371645.
Cuando se introduce como una matriz, se devuelven las siguientes estadsticas de regresin. Utilice esta clave
para identificar las estadsticas deseadas.

y = 27,64*x1 + 12.530*x2 + 2.553*x3 - 234,24*x4 + 52.318

Ejemplo 3. Utilizar las estadsticas F y r2


En el ejemplo anterior, el coeficiente de determinacin, o r2, es 0,99675, que indicara una relacin marcada
entre las variables independientes y el precio de venta. Puede utilizar la estadstica F para determinar si estos
resultados, con un valor r2 tan alto, se produjeron por azar.
Suponga por un momento que en realidad no existe relacin entre las variables, pero que ha extrado una
muestra peculiar de 11 edificios de oficinas que hace que el anlisis estadstico demuestre una relacin
marcada. El trmino "alfa" se utiliza para la probabilidad de llegar a la conclusin errnea de que existe una
relacin.
F y df en la salida ESTIMACION.LINEAL se pueden utilizar para determinar la probabilidad de que se produzca
por azar un valor F ms elevado. F se puede comparar con los valores crticos de las tablas de distribucin F
publicadas o DISTR.F de Excel se puede utilizar para calcular la probabilidad de que se produzca por azar un
valor F superior. La distribucin F apropiada tiene los grados de libertad v1 y v2. Si n es el nmero de puntos
de datos y const = VERDADERO o se omite, entonces v1 = n df 1 y v2 = df. (Si const = FALSO, entonces
v1 = n df y v2 = df.) DISTR.F(F,v1,v2) de Excel devolver la probabilidad de que se produzca al azar un valor
F superior. En el ejemplo 4, df = 6 (celda B18) y F = 459.753674 (celda A18).
Suponiendo un valor alfa de 0,05, v1 = 11 6 1 = 4 y v2 = 6, el valor crtico de F es 4,53. Puesto que F =
459,753674 es mucho ms elevado que 4,53, es extremadamente improbable que un valor F tan elevado se
produzca por azar. (Con Alfa = 0,05, la hiptesis de que no hay relacin entre conocido_y y conocido_x hay que
rechazarla cuando F sobrepasa el nivel crtico, 4,53.) Con DISTR.F de Excel se puede obtener la probabilidad
de que un valor F tan elevado se produzca por azar. DISTR.F(459,753674. 4. 6) = 1,37E-7, una probabilidad
extremadamente pequea. Se puede concluir, bien buscando el nivel crtico de F en una tabla, o bien utilizando
DISTR.F de Excel, que la ecuacin de regresin es til para predecir el valor tasado de los edificios de oficinas
de este rea. Recuerde que es vital utilizar los valores correctos de v1 y v2 calculados en el prrafo anterior.
Ejemplo 4. Calcular la estadstica t
Otra prueba hipottica determinar si cada coeficiente de la pendiente es til para estimar el valor tasado de un
edificio de oficinas del ejemplo 3. Por ejemplo, para probar si el coeficiente de antigedad tiene significado
estadstico, divida -234,24 (coeficiente de la pendiente de antigedad) entre 13,268. El siguiente es el valor t
observado:
t = m4 se4 = -234,24 13,268 = -17,7
Si el valor absoluto de t es suficientemente alto, puede deducirse que el coeficiente de la pendiente es til para
calcular el valor tasado del edificio de oficinas del ejemplo 3. La tabla muestra los valores absolutos de los 4
valores t observados.
Si consulta una tabla de un manual de estadstica, observar que el valor t crtico, de dos colas, con 6 grados
de libertad y alfa = 0,05 es 2,447. Este valor crtico puede encontrarse tambin utilizando la funcin
DISTR.T.INV de Excel. DISTR.T.INV (0,05.6) = 2,447. Puesto que el valor absoluto de t, 17,7, es superior a
2,447, la antigedad es una variable importante para estimar el valor tasado de un edificio de oficinas. El
significado estadstico de cada una de las dems variables independientes puede probarse de forma similar.
Los siguientes son los valores t observados para cada una de las variables independientes.
Variable
valor t observado
Superficie
5,1
Nmero de oficinas 31,3
Nmero de entradas 4,8
Edad
17,7
Todos estos valores tienen un valor absoluto superior a 2,447; por tanto, todas las variables utilizadas en la
ecuacin de regresin son tiles para predecir el valor tasado de los edificios de oficinas de esta rea.

ESTIMACION.LOGARITMICA
Calcula, en anlisis de regresin, una curva exponencial que se ajusta a los datos y devuelve la matriz de
valores que describe dicha curva. Debido a que esta funcin devuelve una matriz de valores, debe ser
introducida como una frmula de matrices.
La ecuacin de la curva es:
y = b*m^x o
y = (b*(m1^x1)*(m2^x2)*_) (si hay varios valores de X)
donde el valor dependiente y es una funcin de los valores independientes x. Los valores m son bases que
corresponden a cada valor exponencial de x; b es un valor constante. Observe que y, x y m pueden ser
vectores. La matriz que ESTIMACION.LOGARITMICA devuelve es {mn,mn-1,...,m1,b}.
Sintaxis
ESTIMACION.LOGARITMICA(conocido_y;conocido_x; constante; estadstica)
Conocido_y - es el conjunto de valores que ya se conocen en la ecuacin y = b*m^x.
Si la matriz definida por el argumento conocido_y ocupa una sola columna, cada columna de
conocido_x se interpreta como una variable separada.
Si la matriz definida por el argumento conocido_y ocupa una sola fila, cada fila de conocido_x se
interpreta como una variable separada.
Conocido_x - es un conjunto de valores x opcionales que ya se conocen en la ecuacin y = b*m^x.
La matriz conocido_x puede incluir uno o varios conjuntos de variables. Si se usa slo una variable,
conocido_y y conocido_x pueden ser rangos con cualquier forma siempre que sus dimensiones sean
iguales. Si se usa ms de una variable, conocido_y deber ser un rango de celdas de una fila de alto o
una columna de ancho (lo que se conoce tambin como un vector).
Si se omite conocido_x, se asume que sta es la matriz {1;2;3;...} que tiene el mismo tamao que
conocido_y.
Constante - es un valor lgico que especifica si se ha de forzar a la constante b a ser igual a 1.
Si el argumento constante es VERDADERO o se omite, b se calcula normalmente.
Si constante es FALSO, b se definir como 1 y los valores m se ajustarn de manera que y = m^x.
Estadstica - es un valor lgico que especifica si se debern devolver estadsticas de regresin adicionales.
Si estadstica es VERDADERO, ESTIMACION.LOGARITMICA devuelve las estadsticas de regresin
adicionales; de manera que la matriz devuelta {mn,mn-1,...,m1,b; sen,sen-1,...,se1,seb; r 2,sey; F;
df;ssreg,ssresid}.
Si estadstica es FALSO o se omite, ESTIMACION.LOGARITMICA devolver slo los coeficientes m y
la constante b.
Ejemplo 1 coeficientes m y la constante b
1
2
3
4
5
6
7

A
Mes
11
12
13
14
15
16
Frmula
=ESTIMACION.LOGARITMICA(B2:B7;A2:A7;VERDADERO;FALSO)

B
Unidades
33.100
47.300
69.000
102.000
150.000
220.000
Frmula

Nota La frmula del ejemplo debe escribirse como frmula matricial.


Cuando se introduce como una matriz, se devuelven los coeficientes m y la constante b.
y = b*m1^x1 o si se usan los valores de la matriz:
y = 495,3 * 1,4633x
Ejemplo 2. Estadsticas completas

1
2
3
4
5
6
7

A
Mes
11
12
13
14
15
16
Frmula
=ESTIMACION.LOGARITMICA(B2:B7;A2:A7;VERDADERO;VERDADERO)

Nota La frmula del ejemplo debe escribirse como frmula matricial.

B
Unidades
33.100
47.300
69.000
102.000
150.000
220.000

Potrebbero piacerti anche