Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
La correlación estadística constituye una técnica estadística que nos indica si dos
variables están relacionadas o no. Por ejemplo, considera que las variables son el
ingreso familiar y el gasto familiar. Se sabe que los aumentos de ingresos y gastos
disminuyen juntos. Por lo tanto, están relacionados en el sentido de que el cambio
en cualquier variable estará acompañado por un cambio en la otra variable.
Teniendo esto en cuenta, la recta de regresión es la línea recta que mejor se ajusta
a la nube de puntos para dos variables X e Y, es decir, la que permitiría minimizar
el error medio cometido al hacer los pronósticos como si la nube de puntos tuviera
una forma lineal. Por ejemplo: Consideremos un grupo de 4 personas para las que
conocemos sus puntuaciones en determinadas variables X e Y, según se muestra
en las dos primeras columnas de la siguiente tabla:
X Y Y´ Y´-Y (Y´-Y)2
5 3 2 -1 1
6 2 4 2 4
7 4 6 2 4
8 5 8 3 9
A partir de estos valores, y suponiendo que existe una relación lineal entre X e Y,
podemos tratar de pronosticar el valor que alcanzará en la variable Y un sujeto,
conociendo su puntuación en la variable X. Supongamos que la relación existente
entre ambas variables viene determinada por la recta Y = 2X-8. Para comprobar si
esta recta permite realizar un buen pronóstico, comprobaremos si los valores que
toma Y para los cuatro sujetos (según la recta) coinciden con los que efectivamente
hemos observado. Denominamos Y´ a las puntuaciones pronosticadas usando la
recta Y = 2X-8. Así observamos que la puntuación pronosticada para el primer sujeto
es de 2, mientras que la puntuación real obtenida por dicho sujeto ha sido de 3.Se
ha cometido un error en la predicción, que viene determinado por (Y´-Y) (a menudo
interesa que el error no aparezca negativo, es decir, nos da igual que sea por exceso
o por defecto; una forma de evitar el signo es considerando las diferencias al
cuadrado)