Sei sulla pagina 1di 22

ESTADISTICA INFERENCIAL

TRABAJO ESPECIAL 1
Ordinario, Tema 1: Regresión Lineal Simple y
Correlación

NOMBRE: CHRISTIAN SAUL RODRIGUEZ RODRIGUEZ


MATRICULA: 1813680
CARRERA: INGENIERO MECANICO ADMINISTRADOR
DOCENTE: MC. RIGOBERTO AMERICO GARZA LOPEZ
SEMESTRE: 5
SALON: 1301
HORA: M1-M3
Contenido
• Diagrama de flujo
• Mejor estimación de la recta
• Error estándar en la mejor estimación de la recta
• Coeficiente de correlación de Pearson
• Coeficiente de correlación de Spearman
• Relación entre el coeficiente de correlación de Pearson y de Spearman
• Varianza y desviación estándar
• Relación entre desviación estándar y el error estándar en la mejor estimación de
la recta
• Coeficiente de determinación
• Relación entre el coeficiente de determinación y el coeficiente de correlación de
Pearson
• Intervalos de confianza
• Intervalo de confianza para β
• Intervalo de confianza para α
• Intervalo de confianza para μ_(y⁄x_0 )
• Intervalo de confianza para y_0
• Prueba de hipótesis β
• Prueba de hipótesis α
REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Permite determinar el grado de La correlación estadística constituye una


dependencia de las series de valores X técnica estadística que nos indica si dos
e Y, prediciendo el valor y estimado variables están relacionadas o no.
que se obtendría para un valor x que La correlación puede decir algo acerca de
no esté en la distribución. la relación entre las variables. Se utiliza
La regresión lineal simple se basa en para entender:
estudiar los cambios en una variable, • si la relación es positiva o negativa
no aleatoria, afectan a una variable • la fuerza de la relación.
aleatoria, en el caso de existir una • La correlación es una herramienta
relación funcional entre ambas poderosa que brinda piezas vitales de
variables que puede ser establecida información.
por una expresión lineal, es decir, su
representación gráfica es una línea
recta. Es decir, se esta en presencia de
una regresión lineal simple cuando una
variable independiente ejerce
influencia sobre otra variable
dependiente.
Se realizó un estudio sobre la cantidad de azúcar convertida e cierto proceso a distintas
temperaturas.
Los datos se codificaron y registraron como sigue

Temper Azúcar
atura, convertida,
X Y
1.0 8.1
1.1 7.8
1.2 8.5
1.3 9.8
1.4 9.5
1.5 8.9
1.6 8.6
1.7 10.2
1.8 9.3
1.9 9.2
2.0 10.5
DIAGRAMA DE FLUJO
AZUCAR CONVERTIDA

10.5
10.2
9.8
9.5 9.3 9.2
Tipo de diagrama matemático que
8.9
8.5 8.6 utiliza las coordenadas cartesianas
8.1
7.8 para mostrar los valores de dos
variables para un conjunto de datos.
Los datos se muestran como un
conjunto de puntos, cada uno con el
valor de una variable que determina
la posición en el eje horizontal (x) y el
valor de la otra variable determinado
por la posición en el eje vertical (y).

0.8 1 1.2 1.4 1.6 1.8 2 2.2


ESTIMACION DE LA RECTA
x y xy
1.0 8.1 8.1 1 65.61
1.1 7.8 8.58 1.21 60.84
1.2 8.5 10.2 1.44 72.25
1.3 9.8 12.74 1.69 96.04
1.4 9.5 13.3 1.96 90.25
1.5 8.9 13.35 2.25 79.21
1.6 8.6 13.76 2.56 73.96
1.7 10.2 17.34 2.89 104.04
1.8 9.3 16.74 3.24 86.49
1.9 9.2 17.48 3.61 84.64
2.0 10.5 21 4 110.25
X
1.0 8.21
1.1 8.39

1.2 8.57
1.3
1.3 8.75
8.75
1.4
1.4 8.93
8.93
1.5
1.5 9.11
9.11
1.6
1.6 9.29
9.29
1.7
1.7 9.47
9.47
1.8 9.65
1.8 9.65
1.9 9.83
1.9 9.83
2.0 10.01
2.0 10.01
La estimación de la recta calcula
AZUCAR CONVERTIDA las estadísticas de una línea con el
10.5 método de mínimos cuadrados
10.2
9.8 para calculas la línea recta que
9.5 9.3
8.9
9.2 mejor se ajuste a los dato y
8.5 8.6
8.1 después devuelve una matriz que
7.8
describe la línea.
A es la ordenada en el origen, es
decir, es la altura a la que la recta
corta el eje Y. se denomina
también termino independiente.
B también denominada pendiente
es la inclinación de la recta, es
decir, es el incremento que se
produce en la variable y cuando la
variable X aumenta una unidad.
0.8 1 1.2 1.4 1.6 1.8 2 2.2
ERROR ESTÁNDAR DE LA MEJOR ESTIMACIÓN DE LA
RECTA
y (Y- El error estándar de la regresión es el
valor que muestra la diferencia entre
8.1 8.21 0.0121
los valores reales y los estimados de
7.8 8.39 0.3481 una regresión. Es utilizado para
8.5 8.57 4.9X10 valorar si existe una correlación entre
la regresión y los valores medidos.
9.8 8.75 1.1025
Muchos autores prefieren este dato a
9.5 8.93 0.3249 otros como el coeficiente de
8.9 9.11 0.0441 correlación lineal, ya que el error
estándar se mide en las mismas
8.6 9.29 0.4761 unidades que los valores que se
10.2 9.47 0.5329 estudian
9.3 9.65 0.1225
9.2 9.83 0.3969
10.5 10.01 0.4
COEFICIENTE DE CORRELACIÓN DE PEARSON
.
valor Significado
-1 Correlación negativa grande y
El coeficiente de correlación de
perfecta Pearson es una medida de la
-0.9 a -0.99 Correlación negativa muy alta relación lineal entre dos variables
-0,7 a -0.89 Correlación negativa alta
aleatorias cuantitativas. A
diferencia de la covarianza, la
-0.4 a -0.69 Correlación negativa moderada
correlación de Pearson es
-0.2 a -0.39 Correlación negativa baja
independiente de la escala de
-0.01 a -0.19 Correlación negativa muy baja medida de las variables.
0 Correlación nula De manera menos formal, podemos
0.01 a 0.19 Correlación negativa muy baja definir el coeficiente de correlación
de Pearson como un índice que
0.2 a 0.39 Correlación negativa baja puede utilizarse para medir el grado
de relación de dos variables
0.4 a 0.69 Correlación negativa moderada siempre y cuando ambas sean
cuantitativas.
0.7 a 0.89 Correlación negativa alta

0.9 a 0.99 Correlación negativa muy alta

1 Correlación negativa grande y


perfecta
El valor del índice de correlación
varía en el intervalo (-1,1):
Si r = 1, existe una correlación
positiva perfecta. El índice indica
una dependencia total entre las dos
variables denominada relación
directa: cuando una de ellas
aumenta, la otra también lo hace
en proporción constante.
Si 0 < r < 1, existe una
correlación positiva.
Si r = 0, no existe relación
lineal. Pero esto no
necesariamente implica que las
variables son independientes:
pueden existir todavía relaciones no
lineales entre las dos variables.
Si -1 < r < 0, existe una
correlación negativa.
Si r = -1, existe una correlación
negativa perfecta. El índice indica
una dependencia total entre las dos
variables llamada relación inversa:
cuando una de ellas aumenta, la
otra disminuye en proporción
COEFICIENTE DE CORRELACIÓN DE SPEARMAN
 
El coeficiente de correlación de
1.0 8.1 1 2 -1 1 Spearman, ρ (rho) es una medida de
la correlación (la asociación o
1.1 7.8 2 1 1 1 interdependencia) entre dos variables
1.2 8.5 3 3 0 0 aleatorias continuas. Para calcular ρ, los datos
1.3 9.8 4 9 -5 25 son ordenados y reemplazados por su
respectivo orden.
1.4 9.5 5 8 -3 9
1.5 8.9 6 5 1 1
1.6 8.6 7 4 3 9
1.7 10.2 8 10 -2 4
1.8 9.3 9 7 2 4   ( 6 ) (70 )
𝑟=1− =03181
1.9 9.2 10 6 4 16 11 ( 121 −1 )
2.0 10.5 11 11 0 0
RELACIÓN ENTRE EL COEFICIENTE DE CORRELACIÓN DE PEARSON Y DE
SPEARMAN

El coeficiente de
correlación de
Spearman es
prácticamente el mismo
que el coeficiente de
correlación de Pearson,
calculado sobre el rango
de observaciones.
La correlación estimada
entre X e Y se halla
calculando el
coeficiente de
correlación de Pearson
para el conjunto de
rangos pareados.
La correlación de
Spearman puede ser
calculada con la fórmula
de Pearson, si antes
hemos transformado las
VARIANZA Y DESVIACIÓN ESTÁNDAR
La varianza de una x y xy
variable aleatoria es una
medida de dispersión 1.0 8.1 8.1
definida como la
esperanza del cuadrado de 1.1 7.8 8.58
la desviación de dicha
1.2 8.5 10.2
variable respecto a su
media. Está medida en la 1.3 9.8 12.74
unidad de medida de la
variable al cuadrado. 1.4 9.5 13.3
La desviación típica
o desviación 1.5 8.9 13.35
estándar (denotada con el
símbolo σ o s, 1.6 8.6 13.76
dependiendo de la 1.7 10.2 17.34
procedencia del conjunto
de datos) es una medida 1.8 9.3 16.74
de dispersión para
variables de razón 1.9 9.2 17.48
(variables cuantitativas o
cantidades racionales) y 2.0 10.5 21
de intervalo. Se define
RELACIÓN ENTRE DESVIACIÓN ESTÁNDAR Y EL ERROR ESTÁNDAR EN LA MEJOR
ESTIMACIÓN DE LA RECTA
La desviación estándar es un valor
que representan cuanto se alejan
los valores de una distribución de
un valor central (media), y el error
estándar representa la
incertidumbre de una medida (en
este caso la media) y que es
función de la desviación estándar y   𝑆
del tamaño muestral. Cuanto 𝑆𝐸=   0.63262
√𝑛 𝑆𝐸= =0.1907
mayor sea la muestra, menor será √11
nuestra incertidumbre.
Si queremos informar de la
distribución hablaremos de
desviación estándar, pero si
hablamos de un estimador en
concreto (media, mediana,
cuartiles, etc.) será mas correcto
hablar de error estándar.
COEFICIENTE DE DETERMINACIÓN
Relación entre el coeficiente de determinación y el coeficiente de correlación de Pearson

Cuando el coeficiente r de Pearson se eleva al cuadrado, el resultado indica el porcentaje de la variación de


una variable debido a la variación de la otra y viceversa. Es decir, el coeficiente de determinación, r al
cuadrado o r², es la proporción de la variación en Y explicada por X. Puede adoptar cualquier valor entre 0 y 1,
inclusive.
RELACION ENTRE EL COEFICIENTE DE DETERMINACION Y EL COEFICIENTE DE
PEARSON

El Coeficiente de Correlación de Pearson es una medida de la


correspondencia o relación lineal entre dos variables cuantitativas
aleatorias. En palabras más simples se puede definir como un índice
utilizado para medir el grado de relación que tienen dos variables, ambas
cuantitativas.
Teniendo dos variables, la correlación facilita que se hagan estimaciones
del valor de una de ellas, con conocimiento del valor de la otra variable.
Este coeficiente es una medida que indica la situación relativa de los
sucesos respecto a las dos variables, es decir, representa la expresión
numérica que indica el grado de correspondencia o relación que existe
entre las 2 variables. Estos números varían entre límites de +1 y -1.
INTERVALO DE CONFIANZA

Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que


posiblemente incluya el valor de un parámetro de población desconocido. Debido a su naturaleza
aleatoria, es poco probable que dos muestras de una población en particular generen intervalos de
confianza idénticos. Sin embargo, si usted repitiera muchas veces su muestra, un determinado
porcentaje de los intervalos de confianza resultantes incluiría el parámetro de población desconocido.
En este problema se desarrollan los siguientes intervalos: β,α, μ_(y⁄x_0 ), y_0.
 INTERVALOS DE CONFIANZA PARA
INTERVALOS DE CONFIANZA PARA α

Potrebbero piacerti anche