Sei sulla pagina 1di 31

Universidad Nacional

Federico Villarreal

DISPERSIÓN,CORRELACIÓN

CURSO:
ESTADÍSTICA INFERENCIAL
DR.MSc. WILLY VICTOR MANDUJANO MIESES
CONTENIDO
• HISTORIA Y ORIGENES
• DIAGRAMAS DE DISPERSION
• CORRELACION
• ANALISIS DE REGRESION LINEAL SIMPLE
HISTORIA Y ORIGENES
• El término correlación se utilizaba a
mediados del siglo XIX.

• Su introducción en estadística se debe a


Francis Galton en sus estudios sobre la
herencia de caracteres. FRANCIS GALTON

• Karl Pearson a fines del siglo XIX, a pedido


de Galton, estudia y formula el
coeficiente de correlación con la finalidad
de darle soporte científico a los estudios
de Galtón.
KARL PEARSON
HISTORIA Y ORIGENES
• Francis Galton, (1822-1911), fue un polímata británico,
antropólogo, geógrafo, explorador, estadístico y psicólogo.

• Aportes a la ciencia de la estadística:


– Inventó el uso de la línea de regresión, siendo el primero en
explicar el fenómeno de la regresión a la media.
– En las décadas de 1870 y 1880 fue pionero en el uso de la
distribución normal.
– Inventó la máquina Quincunx, un instrumento para demostrar
la ley del error y la distribución normal.
– Descubrió las propiedades de la distribución normal bivariada
y su relación con el análisis de regresión.
– En 1888 introdujo el concepto de correlación, posteriormente
desarrollado por Pearson y Sperman.
HISTORIA Y ORIGENES
• Karl Pearson: (1857-1936) fue un prominente científico,
matemático y pensador británico, que estableció la disciplina
de la estadística matemática.

• Desarrolló una intensa investigación sobre la aplicación de los


métodos estadísticos en la biología y fue el fundador de la
bioestadística.

• Axiomatizó los conceptos de Regresión Lineal y de Coeficiente


de Correlación que inicialmente fueron sugeridos por Galton.

• Hacia 1900, Pearson propuso lo que actualmente se conoce


como el test Chi Cuadrado asociado a la Distribución Chi
Cuadrado.
DIAGRAMAS DE
DISPERSION
¿Qué son los Diagrama de Dispersión?

Un Diagrama de Dispersión es la forma mas sencilla de definir si


existe o no una relación causa efecto entre dos variables; es
decir, conocer que sucede con una variable si la otra aumenta o
disminuye. Ejemplo: Altura en
cm. Peso en Kg.
X Y
162 61
154 60
180 78
158 62
171 66
169 60
166 54
176 84
163 68

... ...
2. Como Elaborar un Diagrama de
Dispersión
1. Paso 1; Reunir pares de datos (x,y) que
usted quiere estudiar y organice la
información
2. Paso 2; Encuentre los valores mínimos y
máximos para x y y, decida las escalas que
va usar en los ejes horizontal y vertical.
• Paso 3; Registre los datos en el gráfico y
cuando obtenga mimos valores en diferentes
observaciones, muestre estos puntos
haciéndole círculos concéntricos (O), o
registre el segundo punto muy cerca del
primero.
4. Paso 4; Registre todos los aspectos que
pueden ser utilidad, como:
- Titulo del Diagrama
- Periodo de Tiempo
- Número de pares de datos
- Titulo y unidades de medida de cada eje
- nombre de la persona que hizo el diagrama
Como leer los Diagramas de Dispersión

• Hay muchos tipos de formas de dispersión


algunas formas típicas se describen a
continuación
– Correlación Positiva
– Correlación Negativa
– Correlación Curvilinea
3. Diagramas de Dispersión Positiva
Diagramas de Dispersión Negativa
Diagrama de Dispersión curvilinea
CORRELACION
ANALISIS CORRELACIONAL

Es el método de juzgar la existencia de correlación


haciendo u diagrama de dispersión y calculando el
coeficiente de correlación. Normalmente, el primer paso
es mostrar los datos en un diagrama de dispersión.
PROPIEDADES:
1. r siempre está comprendido entre -1 y 1.
2. Si r = 1 ó r = -1 entonces los puntos de la
muestra están situados en línea recta
(correlación lineal perfecta).
3. Si r está próximo a 1 ó a -1, habrá una
asociación lineal fuerte entre ambas variables
4.Si r es cercano a 0, habrá una asociación lineal
muy débil
5. Si es igual a cero se concluirá que no existe relación lineal
alguna entre ambas variables.
TIPOS DE CORRELACION
CORRELACION BIVARIADA O SIMPLE
• Es la relación que se da
entre dos variables
cuantitativas y
cualitativas.

• Para cada uno de estos tipos de variables


existen diversos coeficientes de correlación
que miden el nivel de asociación entre estas
variables.
COEFICIENTE DE CORRELACION DE PEARSON

Describe la intensidad de la relación entre dos variables.

El valor del coeficiente de correlación puede tomar valores


desde -1 a 1.

Mientras más cercano a uno sea el valor del coeficiente de


correlación, en cualquier dirección, más fuerte será la
asociación lineal entre las dos variables.

Mientras más cercano a cero sea el coeficiente de


correlación indicará que más débil es la asociación entre
ambas variables.
TIPOS DE CORRELACION
CORRELACION BIVARIADA O SIMPLE
• Coeficiente de Correlación de Pearson
Indica el grado y la dirección de la relación lineal entre dos
variables cuantitativas.

r = -1 r = -0.5 r=0 r = 0.5 r=1

Correlación - Correlación - Correlación + Correlación


fuerte débil débil +fuerte
TIPOS DE CORRELACION
CORRELACION PARCIAL
• Ocurre en un modelo de regresión múltiple cuando se
quiere saber la relación entre la variable dependiente con
una de las variables independientes, dejando las otras
constantes.

X2 X1 Y

X1 X2 Y
TIPOS DE CORRELACION
CORRELACION ESPURIA
• El realizar un análisis de correlación, el marco
teórico brinda las bases para explicar por que
se espera que se relacionen las variables.

• Se denomina correlación espuria cuando a


pesar de existir un grado de asociación entre
variables no existe ninguna teoría que
explique tal relación.
TIPOS DE CORRELACION
CORRELACION ESPURIA
• Un ejemplo de una relación espuria puede ser
ilustrado examinando las ventas de helados de
una ciudad. Éstas son más altas cuando la tasa
de sofocamientos es mayor. Sostener que la
venta de helados causa los sofocamientos
sería implicar una relación espuria entre las
dos. En realidad, una ola de calor puede haber
causado ambas. La ola de calor es un ejemplo
de variable escondida.
EJEMPLO DE CORRELACIÓN:

la siguiente muestra contiene los precios y las cantidades vendidas de un bien para un
vendedor, determine el coeficiente de correlación de Pearson r, asimismo diga que
representa.

PRECIO = X Cantidad =Y XY X2 Y2
25 60 1500 625 3600
20 85 1700 400 7225
35 110 3850 1225 12100
40 195 7800 1600 38025
60 140 8400 3600 19600
55 160 8800 3025 25600
45 80 3600 2025 6400
15 40 600 225 1600
20 55 1100 400 3025
30 90 2700 900 8100
40 115 4600 1600 13225
50 120 6000 2500 14400
70 130 9100 4900 16900
45 95 4275 2025 9025
550 1475 64025 25050 178825
SX=550 SY=1475 SXY= 64025 SX2= 25050 SY2=178825
Resumen

Estadísticas de la regresión
Coeficiente de correlación Simple 0.676891059
Coeficiente de determinación R^2 0.458181505
R^2 ajustado 0.413029964
Error típico 32.52067382
Observaciones 14

Siendo r 2 = 0.45, entonces el 45% de los cambios de las ventas son explicadas
por los cambios en el precio de venta, la diferencia del 55% lo explican las otras
variables no incluidas
EJERCICIO

Potrebbero piacerti anche