Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
DOCENTE:
Ortiz Castro Gerardo
ESTUDIANTE:
Arcela Ramírez Yuvitza
TEMA:
TEMATÍCA
DEDICATORIA
AGRADECIMIENTO
ÍNDICE
INTRODUCCIÓN
TÍTULO DEL TEMA DE INVESTIGACIÓN
I. PROBLEMA DE INVESTIGACIÓN 7
VI. CONCLUSIONES 32
6.1. Conclusiones
VII. REFERENCIAS BIBLIOGRÁFICAS 33
VIII. ANEXOS 34
INTRODUCCIÓN
determinar algún tipo de relación de dependencia entre las variables con el fin de
tensión arterial diastólica en setenta individuos de los que se conoce además su edad,
Los mencionados estudios en clínica han dado como resultado diversas tablas,
gráficas y ecuaciones que han servido para predecir valores de Edad, Colesterol, IMC
según la TAD.
Hemos visto como el modelo de regresión lineal simple es un método sencillo para
analizar la relación lineal entre dos variables explicitas. Sin embargo, lo que se
variables, siendo necesario considerar el modelo de regresión lineal múltiple como una
variables.
Aplicación de regresión para un problema de la Tensión
Arterial Diastólica ajuntando por Colesterol e Índice de
Masa Corporal.
I. PROBLEMA DE INVESTIGACIÓN 7
corporal. Es bien conocido que el valor de la tensión arterial diastólica varía en función
del colesterol e índice de masa corporal de cada sujeto. Al igual que ocurría en el caso
1.2. PREGUNTAS:
relaciones causales. Ante de empezar, una serie de condiciones que se deben cumplir
La variable dependiente (resultado) debe ser ordinal o escalar, es decir, que las
peso, número de hijos, justificación del aborto en una escala de 1-nunca a 10-
siempre.
9
altamente correlacionadas entre sí, las relaciones entre las causas y el resultado
deben ser lineales, todas variables deben seguir la distribución normal y deben
tener varianzas iguales. Estas condiciones no son tan estrictas y hay maneras de
es una técnica estadística que señala si dos variables (una independiente y otra
señala si las medias entre dos o más grupos son similares o diferentes
Correlación bivariada:
3.1. HIPOTESIS:
Existe relación entre la Edad y colesterol sobre la concepción de IMC y su relación con
3.2. VARIABLES:
Variable independiente:
Variable dependiente:
O2 Determinar la relación
P2 ¿Existe relación entre el H2 Existe relación entre el
entre el Colesterol y TAD
Colesterol y TAD de la Unidad Colesterol y TAD de la
de la Unidad de
de Epidemiología Clínica y Unidad de Epidemiología
Epidemiología Clínica y TENSIÓN ARTERIAL DIASTÓLICA
Bioestadística. Complexo Clínica y Bioestadística.
Bioestadística. Complexo
Hospitalario Juan Canalejo. A Complexo Hospitalario
Hospitalario Juan Canalejo.
Coruña. ? Juan Canalejo. A Coruña.
A Coruña.
alta son aquellos con valores mayores de colesterol e índice de masa corporal. Si el
Tabla 1. Edad, Colesterol, Índice de Masa Corporal y Tensión Arterial Diastólica de 70 pacientes.
X1 X2 X3 Y
EDAD COLESTEROL IMC TAD
1 42 292 31.64 97
2 64 235 30.8 90
3 47 200 25.61 80
4 56 200 26.17 75
5 54 300 31.96 100
6 48 215 23.18 67
7 57 216 21.19 0
8 52 254 26.95 70
9 67 310 24.26 105
10 46 237 21.87 70
11 58 220 25.61 70
12 62 233 27.92 75
13 49 240 27.73 90
14 56 295 22.49 95
15 63 310 0 95
16 64 268 30.04 90
17 67 243 23.88 85
18 49 239 21.99 75
19 53 198 26.93 75
20 59 218 0 85
21 65 215 24.09 70
22 67 254 28.65 105
23 49 218 25.71 85
24 53 221 25.33 80
25 57 237 25.42 90
26 47 244 23.99 85
27 58 223 25.2 70
28 48 198 25.81 85
29 51 234 26.93 80
30 49 175 27.77 80
31 68 230 30.85 70
32 58 248 21.61 75
33 54 218 26.3 95
34 59 285 31.44 100
35 45 253 25 75
36 53 187 23.31 80
37 43 208 27.15 65
38 57 246 21.09 80
39 64 275 22.53 95
40 43 218 19.83 75
41 47 231 26.17 75
42 58 200 25.95 90
43 58 214 26.3 75
44 48 230 24.89 70
45 62 280 26.89 100
46 54 198 21.09 65
47 67 285 31.11 95
48 68 201 21.6 80
49 55 206 19.78 65
50 50 223 22.99 75
51 53 290 32.32 95
52 63 315 31.14 100
53 60 220 28.89 80
54 46 230 20.55 75
55 45 175 22.49 70
56 53 213 22.53 70
57 59 220 20.82 65
58 62 287 32.32 95
59 60 290 33.91 90
60 62 209 20.76 75
61 58 290 31.35 80
62 57 260 31.14 95
63 49 202 20.76 80
64 61 214 19.59 90
65 52 231 20.08 75
66 59 280 31.6 100
67 50 220 25.34 70
68 46 233 22.86 75
69 44 215 19.53 70
70 60 202 19.1 65
V. RESULTADOS 14
RELACIÓN DE X1-Y
INTERPRETACIÓN
92.53% restante está explicado por otras variables no incluidas en el modelo A medida
que nos acercamos al 100% se podrá decir que nuestro modelo está bien ajustado, que
Las variaciones entre las variables, respecto a la media, provocadas por variables no
VALOR CRITICO DE F
EDAD.
INTERCEPCIÓN
Cuando la edad es 0, los niveles de TAD son de 48.78 puntos. Seria los niveles de
VARIABLE X1
Cuando la variable edad aumenta en 1 año, el valor promedio de TAD seria un 0.57.
PROBABILIDAD- INTERCEPCIÓN
Con valor de probabilidad de 0% aprox. Menor a 5%. Se puede concluir que el valor de
PROBABILIDAD- VARIABLE X1
Con un valor de probabilidad de 2.20% aprox. Menor a 5%. Se puede concluir que la
lineal.
RELACIÓN X2-Y
INTERPRETACIÓN
el 67.53% restante está explicado por otras variables no incluidas en el modelo. A medida que
nos acercamos al 100% se podrá decir que nuestro modelo está bien ajustado, que es bueno para
nuestro análisis.
ERROR TÍPICO
Las variaciones entre las variables, respecto a la media, provocadas por variables no
ANALISIS DE VARIANZA
VALOR CRITICO DE F
que quiere de decir que existe cambios o variaciones significativas de la variable dependiente
INTERCEPCIÓN
Cuando el nivel de COLESTEROL es 0, los niveles de TAD son de 22.45 puntos aproximados.
VARIABLE X1
Cuando la variable COLESTEROL aumenta en 1 punto, el valor promedio de TAD seria 0.25.
PROBABILIDAD- INTERCEPCIÓN
Con valor de probabilidad de 0% aprox. Menor a 5%. Se puede concluir que el valor de la
PROBABILIDAD- INTERCEPCIÓN
Con valor de probabilidad de 3.21% aprox. Menor a 5%. Se puede concluir que el valor de la
PROBABILIDAD- VARIABLE X1
Con un valor de probabilidad de 0% aprox. Menor a 5%. Se puede concluir que la variable
RELACIÓN X3-Y
INTERPRETACIÓN
Las variables están relacionadas positivamente en un 25.72% aproximado. Mostrando así una
ERROR TÍPICO
Las variaciones entre las variables, respecto a la media, provocadas por variables no
ANALISIS DE VARIANZA
Promedio
Grados de Suma de Valor
de los F
libertad cuadrados crítico de F
cuadrados
Regresión 1 1011.64047 1011.64047 4.81738777 0.03159205
Residuos 68 14279.8452 209.997724
Total 69 15291.4857
VALOR CRITICO DE F
INTERCEPCIÓN
aproximadamente
VARIABLE X1
PROBABILIDAD- INTERCEPCIÓN
Con valor de probabilidad de 0% aprox. Menor a 5%. Se puede concluir que el valor de la
PROBABILIDAD- VARIABLE X1
Con un valor de probabilidad de 3.16% aprox. Menor a 5%. Se puede concluir que la variable
RELACIÓN DE X1X2-Y
INTERPRETACIÓN
Estadística de regresión
COEFICIENTE DE CORRELACIÓN MÚLTIPLE
variable explicada TAD en un 57.68% aproximado. Mostrando así una correlación positiva
moderada.
TAD y el 66.73% restante está explicado por otras variables no incluidas en el modelo.
ERROR TÍPICO
Las variaciones entre las variables, respecto a la media, provocadas por variables no
ANALISIS DE VARIANZA
Total 69 15291.4857
VALOR CRITICO DE F
Como el valor p (2%) es menor al 5% se puede concluir que el modelo es estadísticamente
variable explicada TAD ante cambios o variaciones en las variables explicativas EDAD Y
COLESTEROL.
ón 09 85 05 15 26 74
X1 44 08 77 38 49 75
X2 48 9 43 0.00 19 01
INTERCEPCIÓN
Cuando las variables explicativas EDAD y COLESTEROL son cero, manteniendo el resto
VARIABLE X1
promedio.
VARIABLE X2
Cuando la variable explicativa X2 (COLESTEROL), aumenta en un punto, manteniendo las
demás variables X1 (EDAD) constantes, los niveles de TAD aumentan en 0.23 puntos en
promedio.
PROBABILIDAD- INTERCEPCIÓN
Con valor de probabilidad de 28.05% aprox. Mayor a 5%. Se puede concluir que el valor de la
PROBABILIDAD- VARIABLE X1
Con un valor de probabilidad de 37.25% aprox. Mayor a 5%. Se puede concluir que la variable
múltiple.
PROBABILIDAD- VARIABLE X2
Con un valor de probabilidad de 0% aprox. Menor a 5%. Se puede concluir que la variable
lineal múltiple.
RELACIÓN DE X1X3-Y
INTERPRETACIÓN
Estadística de regresión
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.36410278
Coeficiente de determinación R^2 0.132570835
R^2 ajustado 0.106677427
Error típico 14.07033541
Observaciones 70
COEFICIENTE DE CORRELACIÓN MÚLTIPLE
Las variables explicativas EDAD y IMC están relacionadas positivamente con la variable
explicada TAD en un 36.41% aproximado. Mostrando así una correlación positiva moderada.
Las variables explicativas EDAD y IMC explican en 13,25% a la variable explicada TAD y el
ERROR TÍPICO
Las variaciones entre las variables, respecto a la media, provocadas por variables no
ANALISIS DE VARIANZA
VALOR CRÍTICO DE F
Lo que quiere de decir que existen cambios o variaciones significativas de la variable explicada
Cuando las variables explicativas EDAD y IMC son cero, manteniendo el resto constante, los
VARIABLE X1
variables X3 (IMC) constantes, los niveles de TAD aumentan en 0.54 puntos en promedio.
VARIABLE X3
variables X1 (EDAD) constantes, los niveles de TAD aumentan en 0.61 puntos en promedio.
PROBABILIDAD- INTERCEPCIÓN
Con valor de probabilidad de 01.99% aprox. MENOR a 5%. Se puede concluir que el valor de
PROBABILIDAD- VARIABLE X1
Con un valor de probabilidad de 02.67% aprox. MENOR a 5%. Se puede concluir que la
lineal múltiple.
PROBABILIDAD- VARIABLE X3
Con un valor de probabilidad de 23.82% aprox. MENOR a 5%. Se puede concluir que la
múltiple.
RELACIÓN DE X2X3-Y
INTERPRETACIÓN
Estadística de regresión
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.580384383
Coeficiente de determinación R^2 0.336846031
R^2 ajustado 0.317050391
Error típico 12.3025355
Observaciones 70
variable explicada TAD en un 58.03% aproximado. Mostrando así una correlación positiva
moderada.
TAD y el 66.32% restante está explicado por otras variables no incluidas en el modelo.
ERROR TÍPICO
Las variaciones entre las variables, respecto a la media, provocadas por variables no
ANALISIS DE VARIANZA
Grados de Suma de Promedio de los Valor
libertad cuadrados cuadrados F crítico de F
Regresión 2 5150.876278 2575.438139 17.0161721 0.00
Residuos 67 10140.60944 151.3523796
Total 69 15291.48571
VALOR CRÍTICO DE F
que quiere de decir que existen cambios o variaciones significativas de la variable explicada
INTERCEPCIÓN
Cuando las variables explicativas CORESTEROL y IMC son cero, manteniendo el resto
VARIABLE X2
demás variables X3 (IMC) constantes, los niveles de TAD aumentan en 0.23 puntos en
promedio.
VARIABLE X3
Cuando la variable explicativa X3 (IMC), aumenta en un punto, manteniendo las demás
promedio.
PROBABILIDAD- INTERCEPCIÓN
Con valor de probabilidad de 09.92% aprox. Mayor a 5%. Se puede concluir que el valor de la
PROBABILIDAD- VARIABLE X2
Con un valor de probabilidad de 0% aprox. MENOR a 5%. Se puede concluir que la variable
lineal múltiple.
PROBABILIDAD- VARIABLE X3
Con un valor de probabilidad de 27.13% aprox. MAYOR a 5%. Se puede concluir que la
lineal múltiple.
RELACIÓN DE X1X2X3-Y
Existe relación entre Edad; colesterol y IMC sobre la Tensión arterial diastólica.
INTERPRETACIÓN
Estadística de regresión
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.587731269
Coeficiente de determinación R^2 0.345428045
R^2 ajustado 0.315674774
Error típico 12.31491932
Observaciones 70
Las variables explicativas EDAD; CORESTEROL y IMC están relacionadas positivamente con
la variable explicada TAD en un 58.77% aproximado. Mostrando así una correlación positiva
moderada.
explicada TAD y el 65.46% restante está explicado por otras variables no incluidas en el
modelo.
ERROR TÍPICO
Las variaciones entre las variables, respecto a la media, provocadas por variables no
ANALISIS DE VARIANZA
VALOR CRÍTICO DE F
Como el valor p 0<0.05 se puede concluir que el modelo es estadísticamente significativo. Lo
que quiere de decir que existen cambios o variaciones significativas de la variable explicada
TAD ante cambios o variaciones en las variables explicativas EDAD; CORESTEROL Y IMC.
INTERCEPCIÓN
Cuando las variables explicativas EDAD; CORESTEROL y IMC son cero, manteniendo el
VARIABLE X1
puntos en promedio.
VARIABLE X2
demás variables X1 (EDAD), X3 (IMC) constantes, los niveles de TAD aumentan en 0.21
puntos en promedio.
VARIABLE X3
puntos en promedio.
PROBABILIDAD- INTERCEPCIÓN
Con valor de probabilidad de 47.45% aprox. MAYOR a 5%. Se puede concluir que el valor de
Con un valor de probabilidad de 35.56% aprox. MAYOR a 5%. Se puede concluir que la
lineal múltiple.
PROBABILIDAD- VARIABLE X2
Con un valor de probabilidad de 0% aprox. MENOR a 5%. Se puede concluir que la variable
lineal múltiple.
PROBABILIDAD- VARIABLE X3
Con un valor de probabilidad de 26.13% aprox. MAYOR a 5%. Se puede concluir que la
múltiple.
VI. CONCLUSIONES 32
6.1. Conclusiones
El análisis de regresión lineal simple, como parte de la inferencia estadística, es fundamental
para determinar relaciones de dependencia lineal entre variables y establecer su validez con el
variable explicada TAD ante cambios o variaciones en las variables explicativas EDAD;
CORESTEROL Y IMC.
que quiere de decir que existen cambios o variaciones significativas de la variable explicada
EDAD.
http://networkianos.com/anova-de-un-factor-que-es-como-analizar/
VIII. ANEXOS 34
60
60
40
40
20 20
0 0
40 45 50 55 60 65 70 50 150 250 350
60 200
150
40
100 y = 0.5738x + 48.785
R² = 0.0747
20 50
0
0 10 30 50 70
10 20 30 40
Series1 Series2
IMC
Linear (Series1) Linear (Series2)
Fig.5. Relación Fig.6. Relación
Edad;IMC-TAD Colesterol;IMC-TAD
120 y = 0.2451x + 22.447
120 y = 0.5738x + 48.785 R² = 0.3247
R² = 0.0747 100
100
80
80
60 60
y = 0.0514x + 21.905 y = 0.0443x + 14.261
40 R² = 0.004 40 R² = 0.07
20 20
0 0
10 30 50 70 90 50 150 250 350
y = 1.6171x + 147.44
300 R² = 0.1099
250
y = 0.5738x + 48.785
R² = 0.0747
200
150
100
y = 0.0514x + 21.905
R² = 0.004
50
0
10 20 30 40 50 60 70 80