Sei sulla pagina 1di 55

MEDIDAS DE DISPERSIÓN

1. Calcular todas las medidas de dispersión para la siguiente


distribución:

a) Rango

R= LS-Li = 25-5 = 20

b) Varianza

a. Media aritmética

X = 75/5 = 15

b. Calculo de Varianza

(15 − 5)2 + (15 − 10)2 + (15 − 15)2 + (15 − 20)2 + (15 − 25)2
𝑉(𝑥) =
25
100 + 25 + 0 + 25 + 100
𝑉(𝑥) =
25

𝑉(𝑥) = 10

c) Desviación estándar

∂ = √𝑉(𝑥)

∂ = √10

∂ = 3,16

d) Coeficiente de Variación


𝐶𝑉 = x100%
X
3.16
𝐶𝑉 = x100%
15

𝐶𝑉 = 21.08%

2. Calcular todas las medidas de dispersión para la siguiente


distribución:
Xi 0-100 100-200 200-300 300-400
ni 90 140 150 120

a) Rango

R= LS-Li = 400-0 = 400

b) Varianza

a. Media aritmética

50𝑥90 + 150𝑥140 + 250𝑥150 + 350𝑥120


𝑦=
500

𝑦 = 210

b. Calculo de Varianza

(210 − 50)2 + (210 − 150)2 + (210 − 250)2 + (210 − 350)2


𝑉(𝑥) =
500

𝑉(𝑥) = 10800

c) Desviación estándar

∂ = √𝑉(𝑥)

𝜕 = √10800

𝜕 = 103.92

d) Coeficiente de Variación


𝐶𝑉 = x100%
X
103.92
𝐶𝑉 = 𝑥100%
210

𝐶𝑉 = 49.48%

3. Una empresa de fabricación de productos cerámicos dispone de tres


centros de producción. En el centro A, el mas grade y moderno, se
hace un estudio de los m2 de azulejo producidos al mes durante el año
pasado, obteniéndose una media de producción mensual XA=250000
m2, con una desviación típica SA= 15000 m2. Se sabe que el centro B ,
por tener maquinaria mas anticuada que A , produce cada mes un
tercio de la producción de A, y del centro C, por tener un horno menos
que B, produce cada mes 25000 m2 menos que B ¿Cuál es la media y la
varianza de la producción mensual de C?

Media de producción de C:

x A  250000
xi A
xi C   25000
3
N N xi A
 xiC ( 3  25000)
1 N
xC  i 1
N
 i 1
N
  xi  25000
3 i 1 A
xA
xC   25000
3
250000
xC   25000  58333
3

Varianza de producción de C:

S A  15000
N

 (x iA  xA )2
SA  i 1
N
N N xiA xA N
1 N

 ( xiC  xC ) 2 ( 3
 25000  [
3
 25000]) 2  9
( xiA  x A ) 2
1  (x iA  xA )2
SC  i 1
 i1  i 1  i 1
N N N 3 N
1 1
SC  S A   15000  5000
3 3

4. Sumando 5 a cada numero de del conjunto 3, 6, 2, 1, 7,5,


obteniéndose 8, 11, 7, 6, 12,10. Probar que ambos conjuntos de
números tienen la misma desviación típica pero diferentes medias
¿Cómo se relacionan las medidas?

3+6+2+1+7+5
𝑋=
6

𝑋=4
(4 − 3)2 + (4 − 6)2 + (4 − 2)2 + (4 − 1)2 + (4 − 7)2 + (4 − 5)2
𝑉(𝑥) =
6
28
𝑉(𝑥) =
6

28
𝜕=√
6

𝜕 = 2.16

8 + 11 + 7 + 6 + 12 + 10
𝑋=
6

𝑋=9

(9 − 8)2 + (9 − 11)2 + (9 − 7)2 + (9 − 6)2 + (9 − 12)2 + (9 − 10)2


𝑉(𝑥) =
6
28
𝑉(𝑥) =
6

28
𝜕=√
6

𝜕 = 2.16

5. Multiplicando cada numero 3, 6, 2, 1, 7,5, por 2 sumando entonces


5, obteniéndose el conjunto 11, 17, 9, 7, 19, 15.¿Cual es la relación
entre la desviación típica de ambos conjuntos? ¿ Y entre las medias?

3+6+2+1+7+5
𝑋=
6

𝑋=4

(4 − 3)2 + (4 − 6)2 + (4 − 2)2 + (4 − 1)2 + (4 − 7)2 + (4 − 5)2


𝑉(𝑥) =
6
28
𝑉(𝑥) =
6

28
𝜕=√
6
𝜕 = 2.16

11 + 17 + 9 + 7 + 19 + 15
𝑋=
6

𝑋 = 13

(13 − 11)2 + (13 − 17)2 + (13 − 9)2 + (13 − 7)2 + (13 − 19)2 + (13 − 15)2
𝑉(𝑥) =
6
28
𝑉(𝑥) = 4𝑥
6

28
𝜕 = √4𝑥
6

𝜕 = 2𝑥2.16

6. Tenemos una variable X de la que sabemos que: CV= 0,5 y que


Sx= 3 ¿Cuál es el valor de la media de X?

𝐶𝑉 = 0.5

𝑋=6

7. El coeficiente de variación de la variable X sabemos que es 1 ¿Qué


podemos decir de su media y su varianza?

𝑆
𝐶𝑉 =
𝑥̅
𝑆
1=
𝑥̅

𝑆 = 𝑥̅

√𝑉𝑥 = 𝑥̅

𝑥̅ 2 = 𝑉(𝑥)

Interpretación

La varianza es equivalente a la media elevada al cuadrado


8. En el siguiente histograma se representa la distribución de los
salarios (variable x), en miles de soles de una institución del sector de
salud:

DISTRIBUCIÓN DE LOS SALARIOS EN


MILES DE SOLES EN UNA INSTITUCIÓN
DE SALUD
0.25
MILES DE SOLES

0.2
0.15
0.1
0.05
0

SALARIOS

Fuente: Tabla 8.A

Conforme con esta información determinar:

a) Tabla estadística de frecuencias


Solución:
Reemplazamos los miles de soles por soles para homogenizar las
unidades.
Intervalo del percentil
80 Intervalo modal
Intervalo
TABLA 8.A. mediano
DISTRIBUCIÓN DE LOS SALARIOS EN UNA INSTITUCIÓN DE SALUD

Variable
x
80- 100- 120- 140- 160- 180- 200- 220- 240-
(marcas 0-60 60-80 total
100 120 140 160 180 200 220 240 260
de
clase)
soles 50 80 60 40 70 100 120 160 170 200 0
Ni 50 130 190 230 300 400 520 680 850 1050 1050
yi 30 70 90 110 130 150 170 190 210 230 250
yi.ni 1500 5600 54000 4400 9100 15000 20400 30400 35700 46000 0 222100
Fuente: Datos proporcionados por el profesor del curso.
b) Salario mediano, moda y coeficiente de variación
Solución:
Para hallar el salario mediano hallamos primero la mediana:
Mediana:
Como tenemos datos agrupados utilizamos la siguiente fórmula:
𝑛
− 𝑁𝑖−1
𝑀𝑒 = 𝑌`𝑖−1 + 𝑐 [ 2 ]
(𝑁𝑖 − 𝑁𝑖−1 )

Calculamos primero el intervalo mediano:


Como 𝑛 = 1050 , entonces

𝑛 1050
2
= 2
= 525 𝑁𝑖 = 680 𝑌`𝑖−1 = 180
Además 𝑐 = 20

Reemplazando:
525 − 520
𝑀𝑒 = 180 + 20 [ ]
(680 − 520)
𝑀𝑒 = 180 + 0.6 = 180.6

Interpretación:
El 50% de las personas que trabajan en la institución de salud ganan
menos de 180.6 soles.
Moda:
Como tenemos datos agrupados utilizamos la siguiente fórmula:
𝑛𝑖 − 𝑛𝑖−1
𝑀𝑜 = 𝑌`𝑖−1 + 𝑐 [ ]
(𝑛𝑖 − 𝑛𝑖−1 ) + (𝑛𝑖 − 𝑛𝑖+1 )
Reemplazando:
200 − 170
𝑀𝑜 = 220 + 20 [ ]
(200 − 170) + (200 − 0)

𝑀𝑜 = 220 + 20 = 220

Interpretación:
Las personas que trabajan en la institución de salud ganan con
frecuencia 220 soles.
Coeficiente de variación:
Se calcula de acuerdo a la siguiente fórmula:
𝑆
𝐶𝑉 = . 100
𝑋̅

Entonces debemos calcular primero 𝑆:


Desviación estándar
De acuerdo a:
𝑆 = √𝑉(𝑥)
Entonces debemos calcular primero 𝑉(𝑥):
Varianza:
Por ser datos agrupados utilizamos la siguiente ecuación; considerando
a las personas que trabajan en la institución de salud como una muestra
de la población de instituciones de salud a nivel nacional:
∑𝑚 ̅)2 𝑛𝑖
𝑖=1(𝑦𝑖 − 𝑦
𝑉(𝑥) =
𝑛−1
De acuerdo a esto, debemos calcular primero 𝑦̅:
Media aritmética:
Como tenemos datos agrupados utilizamos la siguiente fórmula:

∑𝑚
𝑖=1 𝑦𝑖 𝑛𝑖
𝑦̅ =
𝑛
Reemplazando:
222100
𝑦̅ =
1050
𝑦̅ = 211.52
Interpretación:
En promedio, las personas que trabajan en la institución de salud ganan
211.52 soles.
Luego reemplazando en:
∑𝑚 ̅)2 𝑛𝑖
𝑖=1(𝑦𝑖 − 𝑦
𝑉(𝑥) =
𝑛−1
Tenemos:
𝑉(𝑥)
(30 − 211.52)2 . 50 + (70 − 211.52)2 . 80 + (90 − 211.52)2 . 60 + (110 − 211.52)2 . 40 +
=
1050 − 1

(130 − 211.52)2 . 70 + (150 − 211.52)2 . 100 + (30 − 211.52)2 . 50 + (170 − 211.52)2 . 120 +

(190 − 211.52)2 . 160 + (210 − 211.52)2 . 170 + (230 − 211.52)2 . 200 + (250 − 211.52)2 . 0

1647475.52 + 1602232.83 + 886026.62 + 412252.42 +


𝑉(𝑥) =
1049
465185.73 + 378471.04 + 1647475.52 + 206869.25 +

74097.66 + 392.77 + 68302.08 + 0

7388781.44
𝑉(𝑥) = = 7043.64
1049
Luego reemplazando en:

𝑆 = √𝑉(𝑥)

Tenemos:

𝑆 = √7043.64 = 83.93

Interpretación:

El promedio de variación del salario de las personas que trabajan en la


institución de salud respecto del salario promedio es 83.93 soles.

Luego reemplazando en:

𝑆
𝐶𝑉 = . 100
𝑋̅

Tenemos:

83.93
𝐶𝑉 = = 0.40 = 40%
211.52

Interpretación:

El promedio del salario de las personas que trabajan en la institución de salud


presenta una variabilidad relativa del 40%, lo que significa que es una muestra
relativamente heterogénea.

c) Sueldo mínimo del 20% de los empleados con mayor sueldo.


¿Qué porcentaje de la nómina corresponde a este grupo?
Solución:
Calculamos es percentil 80:
De acuerdo a la siguiente fórmula:
𝑛𝑗
100 − 𝑁𝑖−1
𝑃𝑗 = 𝑌`𝑖−1 + 𝑐 [ ]
(𝑁𝑖 − 𝑁𝑖−1 )

Hallando el intervalo del percentil 80:

𝑛𝑗 1050.80
= = 840 → 𝑁𝑖 = 850 → 𝑌`𝑖−1 = 200
100 100

Reemplazando:
840 − 680
𝑃80 = 200 + 20 [ ] = 200 + 18.8 = 218.8
(850 − 680)

Interpretación:

El 20% de las personas que trabajan en la institución de salud ganan más de


218.8 soles que es su salario mínimo.

d) De los sueldos de otra empresa perteneciente al sector cerámico


se sabe que el suelo medio de sus trabajadores es de 120.000
ptas., con una varianza de 0.5 y que la mediana de los sueldos es
de 125 ptas. ¿Qué empresa tiene un sueldo medio más
representativo? Razona tu respuesta.
Solución:
Para que una muestra sea representativa debe tener las mismas
características, es decir debe ser lo más homogénea posible. Así para
saberlo calculamos los coeficientes de variación de ambos casos:
Caso1: Institución de salud
𝐶𝑉 = 40%
Caso1: Empresa del sector cerámico
De acuerdo a:
𝑆
𝐶𝑉 = . 100
𝑋̅
Entonces debemos calcular primero 𝑆 y 𝑋̅ :
Desviación estándar
De acuerdo a:
𝑆 = √𝑉(𝑥)
Entonces debemos calcular primero 𝑉(𝑥):
Varianza:
𝑉(𝑥) = 0.5

Luego reemplazando en:

𝑆 = √𝑉(𝑥)

Tenemos:

𝑆 = √0.5 = 0.71

Interpretación:

El promedio de variación del salario de las personas que trabajan en la


empresa del sector cerámico respecto del salario promedio es 0.71 soles.

Luego, la media aritmética (sueldo medio):


𝑋̅ = 120 000

Luego reemplazando en:

𝑆
𝐶𝑉 = . 100
𝑋̅

Tenemos:

0.5
𝐶𝑉 = = 0.000004 = 0.0004%
120000

Interpretación:

El promedio del salario de las personas que trabajan en la institución de salud


presenta una variabilidad relativa del 0.0004%, lo que significa que es una
muestra relativamente muy homogénea.

Respuesta:

El salario medio más representativo es el de la empresa del sector cerámico


porque su muestra es superiormente más homogénea que la muestra de la
institución de salud, esto debido a que el coeficiente de variación de los
sueldos de la empresa del sector cerámico es muy mínimo llegando casi a cero
mientras que la de los salarios de la institución de salud bordea el 40%.

9. Sea una distribución de frecuencias con las siguientes


características x  4 : S =1.2 ; n =30 . Determinar estas medidas para
2

la distribución yi  xi  10
Sea la varianza:

∑(x 1  x) 2
S2  i -1

n -1
Reemplazando en los datos
30

∑(x 1  4) 2
S 2  1.2  i -1

30 - 1

y  x  k  4  10  14
10. La siguiente tabla muestra los coeficientes de inteligencia de 480
niños de una escuela elemental

CI 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126

ni 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2

a) El CI medio de los niños estudiados


b) Su desviación típica
c) Si una madre afirma que exactamente la mitad de los niños del
colegio tienen un CI superior al de su hijo, ¿Qué CI tiene el niño?
d) Supongamos que se quieren hacer estudios sobre el proceso de
aprendizaje de los niños con mayor CI pero el psicólogo solo
puede atender al 15% de los niños del centro ¿Qué CI deberá
tener un niño como mínimo para ser considerado dentro de ese
grupo de elegidos?
e) Se van a preparar unas clases de apoyo para un 25% de los
niños del centro, precisamente para aquellos que tengan un
menor CI. ¿Hasta que niños de qué CI debemos considerar en
estas clases?

70 * 4  74 * 9  78 *16  82 * 28  .......126 * 2
a) x   95.97  96
480

b) La desviación estándar
Sabemos que:

∑( y 1  y) 2 ni
S2  i -1
n -1

∑(70  96) 2
4  (74  96) 2 9  (78  96) 2 16........(126  96) 2 2
S2  i -1
 116.82
480 - 1

S  S 2  116.82  10.8
c) Calcular el rango intercuartil

Rq  P75  P25

P75
Hallando primero ; Donde:

 jn 
  N i 1 
jn 75 * 480
Pj  P75  y i´  1  C  100    360
 N i  N i 1  100 100
 

* N i  57

* yi´ 1  32

* N i  1  35

 56,25  35 
P75  32  9   *C 9
 57  35 

 21,25 
P75  32  9  
 22 

P75  32  8,69

P75  40,69

d) Supongamos que se quiere hacer un estudio sobre el proceso del


aprendizaje de los niños con mayor CI pero el psicólogo sólo puede
atender al 15% de los niños del centro ¿Qué CI debería tener un niño
como mínimo para ser considerado dentro de ese grupo de elegidos?

Solución:

Calculamos el percentil 85.


Como el número de datos es impar, aplicamos la siguiente fórmula:
85(𝑛 + 1) 85(480 + 1)
= = 408.85 → 𝑁𝑖 = 417 → 𝑥𝑖 = 106
100 100
Interpretación:
El 15% de los 480 niños que estudian en la escuela elemental tiene un
CI mayor a 106.
Respuesta:
Para ser considerado dentro del grupo de estudio un niño debería tener
como mínimo 106 de CI.
e) Se van a preparar unas clases de apoyo para un 25% de los niños del
centro, precisamente para aquellos que tengan menor CI ¿Hasta qué
niños de qué CI debemos considerar para estas clases?
Solución:
Calculamos el percentil 25.
Como el número de datos es impar, aplicamos la siguiente fórmula:
25(𝑛 + 1) 25(480 + 1)
= = 120.25 → 𝑁𝑖 = 168 → 𝑥𝑖 = 90
100 100

Interpretación:

El 25% de los 480 niños que estudian en la escuela elemental tiene un


CI menor a 90.
Respuesta:
Para ser considerado dentro del grupo de clases de apoyo un niño
debería tener como máximo 90 de CI.

11. El coeficiente de variación de los sueldos de 200 trabajadores de


una compañía es 0.57. Después de reajustar todos los sueldos en $
11, este C.V es ahora de 0.50. Sin embargo, la gerencia fija un
sueldo mínimo de $ 71, lo que beneficia a 35 personas, que antes del
reajuste ganaban menos de $ 60, con un sueldo medio de $ 40 por
mes. Determine la cantidad de dinero que necesitara mensualmente
la compañía, para pagar los sueldos después de hacer efectivos los
reajustes.


CV1   0.57    0.57  ……………………..1


CV2   0.50    0.50(   11) …………2
  11

Igualando 1 y 2 (La desviación estándar es la misma para ambos casos)

0.57   0.50(   11)    78.5


Entonces la cantidad de dinero (Q) que la compañía necesitará será de:

Q = (𝑋̅ + 11) 200 + 20 ( 35 ) = 18614,285

20 más para alcanzar


el sueldo mínimo
(71-(40+11))

MEDIDAS ESTADÍSTICAS PARA DATOS


CUALITATIVOS
1. Suponga que la población estudiantil de la Facultad de Medicina de
la UNT es de 1200, los cuales se dividen en 300 mujeres y 900
hombres. Calcule:

a.La razón de masculinidad:


R =# hombres
# Mujeres

R = 900/300 = 3

b.El índice de masculinidad:


IM = R * 100

IM = 3*100 = 300

c.La proporción de hombres:

p=
# Hombres
Total

p= 900/1200 = 0.75

d.El porcentaje de hombres:


P = p * 100
P = 0.75*100 = 75

2. En un estudio sobre la fertilidad, de 500 mujeres analizadas, 450


fecundaron. Calcule:

a. La razón de fertilidad

Razón = Número de mujeres fecundadas/ Número de mujeres no


fecundadas

Razón = 450/50 = 9

b. El índice de fertilidad

Índice = Razón x 100

Índice = 9x100 = 900

c. La proporción de mujeres fértiles

Proporción de mujeres fértiles=Número de mujeres fértiles/Total de


mujeres analizadas

Proporción de mujeres fértiles= 450/500 = 0.9

d. El porcentaje de mujeres fértiles

Porcentaje de mujeres fértiles (%)= (Proporción de mujeres fértiles) x 100

Porcentaje de mujeres fértiles (%)= 0.9 x 100 = 90%

3. Un visitador médico compra un producto quirúrgico en $736y lo


vende en $ 920. El sostiene que su ganancia es de solo 20% .Explique:

a. Sobre qué base lo calculó.

Pc= $ 736 G=20%(k)= Pv-Pc

Pv=$ 920 20%(k )= $920-$736


G=20%(k) 20%(k )= 184

k=base con que se calculo la


ganancia k=$ 920

b. ¿Cuál es su ganancia real?

La ganancia es :

G=20%(k)=20%$920=$184

4. Una ciudad tiene 100 000 habitantes (45 000 varones y 55 000

mujeres), y cada año mueren 1 000 (600 varones y 400 mujeres).

Hubo 50 casos (40 varones y 10 mujeres) de cáncer pulmonar al año,

de los 45 murieron (36 varones y 9 mujeres)

Calcule:

a) Tasa de mortalidad bruta:

b) Tasa de mortalidad específica para sexo.

c) Tasa de mortalidad específica para causa, para cáncer pulmonar.

d) Tasa de letalidad para cáncer pulmonar.

e) La proporción de mortalidad proporcionada (PMR)

a) Tasa de mortalidad bruta:

N  de muertos 1 000
TMB  x 10 4  x 10 4  100
N  total de la población 100 000

b) Tasa de mortalidad específica para sexo.

Sexo femenino:

N de muertes del sexo femenino


TMES  x 10 3
N total de mujeres en la población
400
TMES  x 10 3  7.27
55 000

Sexo masculino:

N de muertes del sexo masculino


TMES  x 10 3
N total de hom bres en la población
600
TMES  x 10 3  13,33
45 000

c) Tasa de mortalidad específica para causa, para cáncer pulmonar.

N de muertes de cáncer pulmonar


TMECP  x 10 4
Población total

45
TMECP  x 10 4  45
100 000

d) Tasa de letalidad para cáncer pulmonar.

N de muertes de cáncer pulmonar


TLCP  x 10 3
N de casos de cáncer pulmonar

45
TLCP  x 10 3  900
50

e) La proporción de mortalidad proporcionada (PMP)

Muertes de cáncer pulmonar 45


PMP  x 10 3  x 10 3  45
Muerte general de la población 1000

5. En el hospital María Auxiliadora se atendieron 641 pacientes


embarazadas .Vea la figura No. 01: Daño:
Daño: MUERTE MATERNA

SI NO
Factor

de SI 12 1969 1981

Riesgo: NO 6 4154 4160

ANEMIA 18 6123 6141

a. Calcule la tasa de incidencia para las pacientes embarazadas con


anemia

12 ×1000
T.I.=
1981

TI e  6.05  6

b. Calcule la tasa de incidencia para pacientes embarazadas sin anemia


6
TI o   1000
4160
TI = 1.44  1

c. Calcule e interprete el RR

12  4160
RR 
1981 6

RR = 4.19

Este valor nos indica que en las pacientes embarazadas anémicas habrá
4.19 veces mayor muerte materna que en pacientes embarazadas sin
anemia.
6. Considérese una cohorte de 2000 personas, de las cuales 800 son
fumadoras y 1200 son no fumadoras. La cohorte completa se
observó durante 20 años y 100 de los participantes desarrolló
cáncer pulmonar, de los cuales 90 son fumadores y 10 no lo son.

a. Calcule la tasa de incidencia para participantes fumadores


b. Calcule la tasa de incidencia para participantes no fumadores
c. Calcule el RR

Establecemos la relación que existe entre el factor de riesgo y la


enfermedad, mediante el siguiente cuadro:

CANCER PULMONAR

SI NO

SI 90 710 800

FUMADOR
NO 10 1100 1200

Para hallar las tasas de incidencias, nos fijamos en el estudio que se hizo
durante los últimos 20 años a las 100 personas:

a. Tasa de incidencia para fumadores(f):

𝑐𝑎𝑠𝑜𝑠 𝑛𝑢𝑒𝑣𝑜𝑠 (𝑓)


TI =
𝑐𝑎𝑠𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 (𝑓)

TI = 90/800 = 0.1125

b. Tasa de incidencia para no fumadores (nf):


𝑐𝑎𝑠𝑜𝑠 𝑛𝑢𝑒𝑣𝑜𝑠 (𝑛𝑓)
TI =
𝑐𝑎𝑠𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 (𝑛𝑓)

TI = 10/1200 = 0.0083

b. Riesgo Relativo: Relación entre datos expuestos y no expuestos:

Personas con enfermedad y factor de riesgo Personas con factor de riesgo


RR=
Personas con enfermedad , sin factor de riesgo Personas sin factor de riesgo

RR = (90/800) / (10/1200) = 13.55

7. Durante el estudio, se determina de manera retrospectiva el


número de fumadores y de no fumadores tanto en el grupo de casos
como en el control, como se muestra en el siguiente cuadro:

Grupo de Grupo de control


casos

Fumadores 90 40

No fumadores 10 60

Total 100 100

Bajo tales circunstancias, una estadística llamada desigualdad en el grado


(OR) proporciona una aproximación cercana al riesgo relativo: Calcule e
interprete esta medida.
OR = (a  d )  (c  b) = (90  60)  (10  40) =13.5

Este valor nos indica que existen aproximadamente 14 personas dentro de


las estudiadas que serán fumadoras.

8. En un estudio piloto pequeño, se contacto con 12 mujeres con


cáncer uterino y 12 mujeres aparentemente sanas, se les
preguntó si alguna vez habían usado estrógenos. Los resultados
se muestran a continuación:

Mujeres con cáncer Mujeres sin cáncer


uterino uterino

1 usó estrógenos No usó

2 No uso No usó

3 uso usó

4 uso usó

5 uso No usó

6 No usó No usó

7 uso No usó

8 usó No usó

9 No uso usó

10 No uso usó

11 uso No usó

12 usó No usó

Calcule e interprete la odds ratio (OR)

Enfermedad Cáncer al útero


si no

Factor si 8 4 12

riesgo no 4 8 12

estrógenos 12 12

84
OR = =4
48

Este valor nos indica que habrá aproximadamente 4 mujeres con cáncer
uterino cuando se ha usado estrógenos

Por lo tanto, el uso de estrógenos fue 4 veces más frecuente en casos que en
controles

9. En los estudios de caso control:

a) Sus casos son 100 mujeres con cáncer mamario ¿Cuál es el


prerrequisito esencial del grupo control?

El prerrequisito del grupo control es que los integrantes del grupo no


deben haber sido detectados con cáncer mamario.

b) Su hipótesis es que en el primer embarazo en edad joven, la


protege de cáncer mamario ¿Igualaría usted el estado
socioeconómico en los casos de control? Dé sus razones.

Si igualaría.
Razones:
 La edad de el primer embarazo en niveles socioeconómicos bajos
es mucho menor que la de niveles superiores, lo cual puede
inducir a error, debido a que podemos determinar una edad muy
joven para el primer embarazo, la cual no cumpliría para niveles
socioeconómicos elevados.
c) ¿Es posible probar la hipótesis de que la tasa de cáncer mamario
es más alta en mujeres solteras que en las casadas, empleando
los mismos 100 casos y los 100 controles?

Si es posible probarla analizando el valor del factor OR, donde


tendremos las mujeres casadas o solteras con cáncer mamario o sin
cáncer mamario.

d) Supóngase que se encontró 80% de las mujeres con cáncer


mamario eran casadas; ¿Esto demuestra que el estar casada
aumenta el riesgo de desarrollar cáncer mamario?

No necesariamente, se necesitaría conocer el porcentaje de casadas en


los controles, para aplicar un ODDS RATIO

e) Se asume que 90% del grupo control está casada. Calcule el


odds ratio de cáncer mamario para las solteras.

ANÁLISIS DE REGRESIÓN Y CORRELACIÓN


1.- El crecimiento de los niños desde la infancia a la adolescencia
generalmente sigue un patrón lineal. Se calculó una recta de regresión
mediante el método de mínimos cuadrados con datos de altura de
niñas norteamericanas de 4 a 9 años y el resultado fue: intercepto 𝒂 =
𝟖𝟎 y pendiente 𝒃 = 𝟔. La variable dependiente 𝒚 es la altura en cm. Y 𝒙
es la edad en años.

a) Interprete los valores estimados del intercepto y la pendiente:


Interpretación:
El intercepto 𝑎 representa al parámetro de la recta, 𝐴0 , es decir, la
ordenada del punto de intersección con el eje 𝑦 , esto significa que
cuando una niña norteamericana nace, mide aproximadamente
80 cm.; mientras que la pendiente 𝑏 representa al parámetro de la
recta, 𝐴1 , es decir, el coeficiente de regresión: la variación neta en 𝑦
por cada unidad de variación en 𝑥, o sea que por cada año las niñas
crecerán 6 cm.
b) ¿Cuál será la altura predicha en una niña de 8 años?
Solución:
Construimos el modelo matemático:
𝑦 ∗ = 𝐴0 + 𝐴1 . 𝑥
Que es lo mismo decir:
𝑦 ∗ = 𝑎 + 𝑏. 𝑥

Reemplazando:
𝑦 ∗ = 80 + 6𝑥
Para 𝑥 = 8, tenemos:
𝑦 ∗ = 80 + 6(8)
𝑦 ∗ = 128
Interpretación:
La altura predicha para una niña de 8 años es 128 cm. ó 1.28 m.
c) ¿Cuál será la altura predicha para una mujer de 25 años?
Solución:
Reemplazando en:
𝑦 ∗ = 80 + 6𝑥
Para 𝑥 = 25, tenemos:
𝑦 ∗ = 80 + 6(25)
𝑦 ∗ = 230
Interpretación:
La altura predicha para una para una mujer de 25 años es 230 cm. o
2.30 m. mas este es un dato erróneo puesto que las mujeres no
alcanzan generalmente esa talla. Esto sucede porque el modelo
matemático calculado es sólo para edades de 4 a 9 años mas no para
25, por lo que para esa edad el crecimiento ya no sigue una
trayectoria lineal ascendente y se necesitaría un modelo matemático
diferente.

2.- Sean 𝒙 e 𝒚 tales que 𝒙


̅ = 𝟓; 𝑺𝟐𝒙 = 𝟐 ;𝒚
̅ = 𝟕 y 𝑺𝟐𝒚 = 𝟖. Sabiendo que 𝒚𝒊 =
𝒂𝒙𝒊 + 𝒃 y que 𝒂 > 0, determinar los valores de estas dos constantes 𝒂 y
𝒃.

Solución:

Aplicamos la forma indirecta de los mínimos cuadrados, con la fórmula:

1
∑ 𝑦𝑖 𝑥𝑖 𝑆𝑥𝑦 𝑆𝑦 𝑆𝑥𝑦 𝑆𝑦
𝑏= 𝑛 = 2 = . = 𝑟
1 𝑆𝑥 𝑆𝑥 𝑆𝑥 𝑆𝑦 𝑆𝑥
∑ 𝑥𝑖2
𝑛
Respuesta:

No podemos calcular porque nos falta el valor de la covarianza.

3. Las siguientes sumatorias se obtienen a partir de 16 observaciones


de las variables “x” y “y”:

Yi  526  Xi  657  XiYi  492  Yi  64


2 2

i i i i

 Xi  96
i
2
 __    
2
 __ 
__ __
a) Calcular
 Yi  y  
 Xi  x    Xi  X 

Yi  Y 

i
  , i
  y

b) Encuentre las estimaciones MCO de la regresión y    x 


i 0 1 i i

c) calcule el coeficiente de determinación R2

__
a) Hallando y :

__ y i 64
y= i
= =4
n 16

2
 __ 
2
__
(y  y )
 y i 4
 Yi  y  2
i
  = i i =
i

 yi  8 y  16n
2
=
i

= 526 – 8(64) + 16(16) = -242


__
Ahora hallamos x

__ x i
96
x= i
= =6
n 16

2
 __ 
  xi  x   xi 6   xi  12 xi  36n  657  12(96)  36(16)  81
2 2

 
 __
 __

Luego hallamos 
 Xi  X 

Yi  Y  , para eso, primero resolvemos:

  Xi  6Yi  4   x y  4 x  6 y  24n  492  4(96)  6(64)  24(16)  108


i i i i

b) Ahora para hallar la ecuación de regresión


  i 
  y   x 
 
i i
y
  x  0i 1
y
tenemos que hallar los valores
i de:
i 0 y0 1 xi1 i
i

   x   =
 x xy
2
y (64)(657)  (96)( 492)
 4
n x  ( x)
2 2
(16)(657)  (96)
0 2

n xy   x y 16(492)  96(64)
    1,33
n x  ( x)
2 2
16(657)  (96)
1 2

Entonces la ecuación de regresión lineal sería:

y     x 
i 0 1 i i

y  1,33 x  4
i i

c) Ahora hallamos el coeficiente de determinación R2, para esto primero


hallamos el coeficiente de correlación.

n xy   x y
r
 n
 x
2
 
2
 
 n
x   y  (
2
y) 
2

16(492)  96(64)
r  0,73
16(657)  2
 16(526)  2

 (96)   (64) 
Entonces el coeficiente de relación es r2:

r2= (0,73)2 = 0.53 (Coeficiente de Determinación)

4. El administrador de un Hospital reunió los siguientes datos sobre el


costo por comida de una comida estándar a diferentes volúmenes de
preparación.

Número de Costo por xy x2 y2


comidas comida(y)
servidas(x)

30 1,15 34,5 900 1,3225

35 1,1 38,5 1225 1,21

40 0,98 39,2 1600 0,9604

45 1,01 45,45 2025 1,0201

50 0,97 48,5 2500 0,9409

55 0,9 49,5 3025 0,81

60 0,89 53,4 3600 0,7921

70 0,85 59,5 4900 0,7225

75 0,78 58,5 5625 0,6084

80 0,7 56 6400 0,49

65 0,8 52 4225 0,64

605 10,13 535,05 36025 9,5169

a) Trace un diagrama de dispersión.


Número de comidas servidas(x)
90
80
Costo por comida
70
60
50 Número de comidas
40 servidas(x)
30
20
10
0
0 0.5 1 1.5
Número comidas servidas

b) Obtenga la ecuación de regresión y grafíquela en el diagrama de


dispersión.

Calculamos los valores de A0 y A1.

 y x   x xy 2

A0 
n x 2  ( x ) 2

10,13(36025)  605(535, 05)


A0 
11(36025)  (605)2
A0  1,36

n xy   x y
A1 
n x 2  ( x) 2

11(535, 05)  605(10,13)


A1 
11(36025)  (605) 2
A1  0, 008

Por lo tanto y  1,36  0, 008 x


ˆ
Número de comidas servidas(x)
90

80

70
Costo por comida

60

50 Número de comidas
40 servidas(x)

30 Linear (Número de comidas


servidas(x))
20

10

0
0 0.5 1 1.5

Número comidas servidas

c) Estime el costo por comida si se sirvieron 47 comidas.

yˆ  1,36  0, 008 x
yˆ  1,36  0, 008(47)
yˆ  0,984

El costo por comida, si se sirvieron 47 comidas, será $0,984.

d) Calcule e interprete el coeficiente de correlación y el coeficiente de


determinación.
Calculamos primero las medias aritméticas de X e Y.

x i y i
x y
n n
605 10,13
x y
11 11
x  55 y  0,92
Operamos en la ecuación de regresión.

yˆ  1,36  0, 008 x
( yˆ ) 2  (1,36  0, 008 x) 2
 yˆ  n(1,36)  0, 008 x yˆ 2  1,8496  0, 02176 x  0, 000064 x 2

 yˆ  11(1,36)  0, 008(605)  yˆ 2
 n(1,8496)  0, 02176 x 0, 000064 x 2

 yˆ  10,12  yˆ 2
 11(1,8496)  0, 02176(605)  0, 000064(36025)

 yˆ 2
 9, 4864

Hallamos el coeficiente de determinación.

 ( yˆ  y) 2

R 
2

 ( y  y)
i
2

 ( yˆ
2
2
 2 yyˆ  y )
R2 
 y 2
i  2 yi y  y
2

 yˆ  2 y  yˆ  n y
2 2

R2 
y  2 y  yi  n y
2 2
i

9, 4864  2(0,92)(10,12)  11(0,92) 2


R2 
9,5169  2(0,92)(10,13)  11(0,92) 2
R 2  0,935

R2 
x100%
 93,5% ; Entonces podemos concluir que: Del 100% de la
variación del número de comidas servidas, un 93,5% suele ocurrir por el
número de comidas.

Hallamos el coeficiente de correlación.

R  R2
R  0,935
R  0,96
Como el valor de R se acerca a uno; concluimos que el grado de relación entre
las variables (dependiente e independiente) es muy alto, por lo tanto el
modelo es adecuado.

e) Calcule el error estándar de estimación.


2

Y  A0  Y  A1  XY
SY . X 
n2
9,5169  1,36(10,13)  (0, 008)(535, 05)
SY . X 
11  2
0, 0205
SY . X 
9
SY . X  0, 047

5. Los datos siguientes muestran la densidad óptica de cierta sustancia


a diferentes niveles de concentración:

N. DE D. ÓPTICA
XY X² Y²
CONCENTRACIÓN (X) (Y)

80 0.08 6.4 6400 0.0064

120 0.12 14.4 14400 0.0144

160 0.18 28.8 25600 0.0324

200 0.21 42 40000 0.0441

240 0.28 67.2 57600 0.0784

280 0.28 78.4 78400 0.0784

320 0.38 121.6 102400 0.1444

360 0.4 144 129600 0.16

400 0.42 168 160000 0.1764

440 0.5 220 193600 0.25

480 0.52 249.6 230400 0.2704

520 0.6 312 270400 0.36

3600 3.97 1452.4 1308800 1.6153


a) Trace un diagrama de dispersión.

0.7

0.6
DENSIDAD ÓPTICA

0.5

0.4

0.3

0.2

0.1

0
0 100 200 300 400 500 600
NIVEL DE CONCENTRACIÓN

b) Obtenga la ecuación de regresión y grafíquela en el diagrama de


dispersión.

 Como la ecuación de regresión es una ecuación lineal de la forma:

Y  a  bX

 Entonces procedemos a hallar los valores de los parámetros a y b.

a
 Y  X   X  XY
2

n X   X 
2 2
Reemplazando los valores de la tabla en las variables, tenemos:

a
3.97 1308800  36001452.4
121308800  36002

5195936  5228640
a
15705600  12960000

 32704
a α = -0.0119
2745600

n XY   X  Y
b
n X 2   X 
2

Reemplazando los valores de la tabla en las variables, tenemos:

b
121452.4  36003.97 
121308800  36002

17428.8  14292
b
15705600  12960000

3136.8
b
2745600

b  0.00114

Obtenemos esta ecuación:


Y  0.00114 X  0.0119

Gráfico del diagrama de dispersión

c) Estime la densidad óptica promedio si se tiene 350 de nivel de


concentración.

 Como tenemos la ecuación lineal ya determinada, solo


reemplazamos los datos dados.

Y  0.00114 X  0.0119
Y  0.00114(350)  0.0119
Y  0.399  0.0119

Y  0.3871

d) Calcule el coeficiente de correlación y el coeficiente de


determinación.

 El coeficiente de correlación se determina mediante la siguiente


formula.
n XY   X  Y
r
n x 2

  X  n Y 2   Y 
2 2

r
121452.4  36003.97 
121308800  36002 121.6153  3.972 
17428.8  14292
r
15705600  1296000019.3836  15.7609
3136.8
r
27456003.6227

3136.8
r
3153.8

r  0.995

 El coeficiente de determinación se obtiene de elevar al cuadrado el


coeficiente de correlación.

r 2  0.9892

e) Calcule el error estándar de estimación.


 El error estándar de estimación lo calculamos a partir de la siguiente
formula.

SY . X 
Y 2
 a Y  b XY
n2

1.6153   0.0119 3.97   0.00114 1452.4 


SY . X 
10

1.6153  0.047243  1.655736


SY . X 
10

0.006807
SY . X 
10

S Y . X  0.0006807
S Y . X  0.026

6. Se llevó a cabo u n experimento para estudiar el efecto de cierto


medicamento para disminuir la frecuencia cardíaca en adultos. La
variable independiente es la dosis en miligramos del medicamento,
y la variable dependiente es la diferencia entre la frecuencia
cardiaca más baja después de la administración del medicamento y
un control antes de administrarlo. Se reunieron los siguientes
datos.
X: Dosis (mg) Y: Disminución de la frecuencia Cardiaca

(latidos/min)

0.5 0.75 1 1.25 1.5 1.75 2 2.25 2.5 2.75 3 3.325 3.5

10 8 12 12 14 12 16 18 17 20 18 20 21

X y X2 xy Y2

0.5 10 0,25 5 100

0.75 8 0,5625 6 64

1 12 1 12 144

1.25 12 1,5625 15 144

1.5 14 2,25 21 196

1.75 12 3,0625 21 144

2 16 4 32 256

2.25 18 5,0625 40,5 324

2.5 17 6,25 42,5 289


2.75 20 7,5625 55 400

3 18 9 54 324 Entonces
podemos
3.25 20 10,5625 65 400 obtener los
datos
3.5 21 12,25 73,5 441
necesarios
6 198 63,375 442,5 3226 SUMA para
resolver el
problema por medio del programa Excel:

∑x=26 ∑y=198 ∑xy=442.5 ∑y2=3226 ∑x2=63.375

a) Trace un diagrama de dispersión.

Con los puntos obtenidos de el reeplazo de 2.3 hallamos puntos de

dispersión junto con los demás puntos presentados en la tabla,tanto en”x”

como en “y”:

22
20
18
16
14
12
11
10
8
6
4
2

0,25 0,5 0,75 1,0 1,25 1,5 1,75 2 2,25 2,5 2,75 3,0 3,25 3,5 3,75

b) Obtenga la ecuación de regresión y grafíquela en el diagrama de

dispersión.

Con los datos obtenidos:


y.x 2  x.xy 198(63,375)  26(442,5) 12548,25  11505
A0   
nx 2  (x) 2 13(63,375)  (26) 2 823,875  676

1043,25
A0   A0  70,54945055
147,875

nxy  x.y 13(442,5)  26(198) 5752,5  5148


A1   
nx 2  (x ) 2 13(63,375)  (26) 2 823,875  676

604,5
A1   A1  4,087912088
147,875

c) Estime la disminución de la frecuencia cardiaca si la dosis es 2.3

mg.

Si x = 2,3; aplicamos la siguiente fórmula:

y = A0 + A 1 x

y = 7,054945055 + 4,087912088x

Reemplazando:

y = 7,054945055 + 4,087912088(2,3)

y = 7,054945055 + 9,402197802 =

y = 16,45714286

Entonces obtenemos los siguientes valores:

x = 0  y = 7,054945055

x = 2,3  y = 16,45714286
d) Calcule el coeficiente de correlación y el coeficiente de

determinación.

Con los datos obtenidos:

Coeficiente de correlación:

nx. y  x.y
  =
[nx  (x) 2 ]  [ny 2  (y ) 2 ]
2

Reemplazamos los valores obtenidos de la tabla:

13(442,5)  26(198)
  =
[13(63,375)  (26) 2 ]  [13(3226)  (198) 2 ]

5752,5  5148
  =
[(823,8759  676][ 41938  39204]

604,5 604,5
  =
(147,875)( 2734) 404290,25

604,5
    0,950713522
635,8382263

Coeficiente de determinación:

Cd = 2

Cd = (0,950713522)2

Cd = 0,9038562

e) Calcule el error estándar de estimación.

Sólo reemplazamos con los datos obtenidos:


y 2  A 0 y  A1x.y
Syx 
n2

[3226  (7,054945055(198)]  [( 4,087912088)( 442,5)]


Syx 
11

3226  (1396,879121)  (1808,901099)


Syx 
11

(1829,120879)  (1808,901099)
Syx 
11

20,21978
Syx 
11

Syx  1,838161818  1,355788265

7. En base a la información que se obtiene de 5 pacientes:

PACIENTE Volumen del


Albúmina Total

Plasma X (cm3)
Circulante Y (grs.)

1 2,5
119

2 2,8
133

3 2,4
121

4 2,5
129

5 3,2
146
a. Halle la relación que se debe usar par predecir la albúmina circulante
del volumen del plasma. Estime los coeficientes de regresión e
interprete.

PACIENTE Volumen del Albúmina Total xy x2


y2

Plasma X (cm3) Circulante Y (grs.)

1 2,5 119 297,5


6,25 14161

2 2,8 133 372,4


7,84 17689

3 2,4 121 290,4


5,76 14641

4 2,5 129 322,5


6,25 16641

5 3,2 146 467,2


10,24 21316

y = ao+a1x

a0 = (648) (36,34) – (13,4) (1750) = 45,94

(5) (36,34) – (13,4)2

(5) (1750) – (13,4) (648)

a1= =31,21

(5) (36,34) – (13,4) 2

Reemplazando:

y = 45,94 + 31,21 x

Coeficientes de regresión:
a0= 45,94

a1=31,21

Interpretación:

Por cada unidad de cambio en X, el cambio promedio en Y es de 31,21

b. Estime la albúmina circulante si l volumen del plasma es de 2,7 cm3


y= 45,91 + 31,21x

y= 45,91 + 31,21(2,7) =130,18

c. Calcule el error estándar de estimación del modelo de regresión:

S y.x= 4,52

8. Estamos familiarizados con el hecho de que la temperatura del aire


disminuye con la altitud del lugar. Los datos de la tabla reportan
una muestra de 10 datos.

TABLA Nº 02: ALTURA Y TEMPERATURA

n X (altura, m) Y (temperatura, ºC)

1 1142 3

2 678 13

3 1002 9

4 566 15

5 208 18

6 1471 14

7 407 16

8 1609 6

9 1277 11

10 437 16

a) Haga la gráfica de dispersión:


20

18

16

14

(Temperatura)
12

10

0
0 200 400 600 800 1000 1200 1400 1600 1800

(Altura)

b) Estime la ecuación de regresión lineal simple. Interprete:

Para hallar la ecuación se necesitan los valores: x 2 , y 2 , x y; además


las sumatorias de: x, y, x2, y2, xy.

n x Y xy x2 y2

1 1142 3 3426 1304164 9

2 678 13 8814 459684 169

3 1002 9 9018 1004004 81

4 566 15 8490 320356 225

5 208 18 3744 43264 324

6 1471 14 20594 2163841 196

7 407 16 6512 165649 256

8 1609 6 9654 2588881 36

9 1277 11 14047 1630729 121

10 437 16 6992 190969 256

x=8797 121 xy=91291 x2=9871541 y2=1673


(x)2 =77387209 (y)2=14641

 y  A0  A1 x

A0 
 y .  x   x  xy 2

n  x  ( x) 2 2

(121) (9871541)  (8797) (91291)


A0   18,35
(10) (9871541)  77387209

A1 
n  xy   y .  y
n  x ( x)
2 2

(10) (91291)  (8797) (121) 151527


A0     0,007
10 (9871541)  77387209 21328201

 y  18,35  0,007 x

La ecuación de regresión lineal simple determinado indica que la altura


es inversamente proporcional a la temperatura, por ende nuestra
ecuación tienen su pendiente negativa.

c) Determine la temperatura del aire promedio (ºC) si se tienen


una altura de 980 m.

Con la ecuación hallada, reemplazaremos 980 m en x (altura), para


encontrar su respectiva temperatura (y).

Y = 18,35 – 0,007 (980) = 11,49ºC

d) Calcule e interprete el R2 y el error estándar de estimación.

 
 xy   x  y
2

n
R 
2 
 n
  x 2
 ( x)  n  y  ( y )  
2 2 2

2
  151527 
R2     0,5884
 (21328201) (10) (1673)  (14641) 
Error estándar de estimación

S y.x 
y 2
 A0  y  A1 x y
n 2

(1673)  (18,35) (121)  (0,007) (91291)


S y. x 
8

 547,35  639,037
  3,39
8

9. Se realiza un estudio para establecer una ecuación mediante la


cual se pueda utilizar la concentración de estrona en la saliva (X) para
predecir la concentración del esteroide en plasma libre (Y). Se
extrajeron los siguientes datos de 14 varones sanos:

X 1,4 7,5 8,5 9 9 11 13 14 14,5 16 17 18 20 23

Y 30 25 31,5 27,5 39,5 38 43 49 55 48,5 51 64,5 63 68

a) Estúdiese la posible relación lineal entre ambas variables.

80
Concentracion de esteroide en

70
60
plasma libre (Y)

50
40
y = 2.2626x + 15.853
30
R² = 0.8356
20
10
0
0 5 10 15 20 25
Concentracion de estrona en la saliva (X)
Los datos muestran una tendencia lineal

b) Obtener la ecuación que se menciona en el enunciado del problema.

i) Elaborando tabla de datos:

X Y X² Y² XY

1.4 30 1.96 900 42


7.5 25 56.25 625 187.5
8.5 31.5 72.25 992.25 267.75
9 27.5 81 756.25 247.5
9 39.5 81 1560.25 355.5
11 38 121 1444 418
13 43 169 1849 559
14 49 196 2401 686
14.5 55 210.25 3025 797.5
16 48.5 256 2352.25 776
17 51 289 2601 867
18 64.5 324 4160.25 1161
20 63 400 3969 1260
23 68 441 4624 1428
∑Y² = ∑XY =
∑X = 181.9 ∑Y = 633.5 ∑X² = 2698.71 31259.25 9052.75

ii) Hallando la ecuación: 𝑦̂ = 𝑎 + 𝑏𝑥

14(9052.75)−(181.9)(633.5)
𝑏= 14(2698.71)−181.92
→ 𝑏 = 2.263
Luego:

𝑌̅ = 633.1/14 = 45.25

𝑋̅ = 181.9/14 = 12.99

Finalmente:

𝑎 = 𝑌̅ − 𝑏 𝑋̅

Reemplazando datos: 𝑎 = 15.859

Por lo tanto: 𝒚
̂ = 𝟐. 𝟐𝟔𝟑 𝒙 + 𝟏𝟓. 𝟖𝟓𝟗

c) Determinar la variación de concentración de estrona en plasma por


unidad de estrona en saliva.

Por cada unidad de estrona en la saliva, la concentración de estrona en el


plasma incrementa en 2.263

10. Los investigadores están estudiando la correlación entre obesidad


y la respuesta individual al dolor. La obesidad se mide como
porcentaje sobre el peso ideal (X). La respuesta al dolor se mide
utilizando el umbral de reflejo de flexión nociceptiva (Y), que es una
medida de sensación de punzada. Se obtienen los siguientes datos:

X 89 90 75 30 51 75 62 45 90 20

Y 2 3 4 4,5 5,5 7 9 13 15 14
16
14
12
Respuesta al dolor

10 y = -0.0629x + 11.642
R² = 0.1115
8
6
4
2
0
0 10 20 30 40 50 60 70 80 90 100
Obesidad

a) ¿Qué porcentaje de la varianza del peso es explicada mediante un


modelo de regresión lineal por la variación del umbral de reflejo?

R² = 0.1115

El % de variación del peso explicada mediante un modelo de regresión


lineal por la variación del umbral de reflejo es 0.1115

b) Estúdiese la posible relación lineal entre ambas variables,


obteniendo su grado de ajuste.

Sabemos que: R² = r²

Entonces: r = √0.1115 → r = 0.334

Por lo tanto: El grado de correlación lineal es baja.

c) ¿Qué porcentaje de sobrepeso podemos esperar para un umbral de


reflejo de 10?

Ecuación lineal: y = -0.0629x + 11.642

Por lo tanto: Hallamos “x” cuando y = 10


10 = -0.0629x + 11.642

x = 26.314

11. En un ensayo clínico realizado tras el posible efecto hipotensor de


un fármaco, se evalua la tensión arterial diastólica (TAD) en
condiciones basales (X), y tras 4 semanas de tratamiento (Y), en un
total de 14 pacientes hipertensos. Se obtiene los siguientes valores de
TAD:

BASAL DESPUES DE 4
PACIENTE X*X Y*Y X*Y
(X) SEMANAS (Y)
1 95 85 9025 7225 8075
2 100 94 10000 8836 9400
3 102 84 10404 7056 8568
4 104 88 10816 7744 9152
5 100 85 10000 7225 8500
6 95 80 9025 6400 7600
7 95 80 9025 6400 7600
8 98 92 9604 8464 9016
9 102 90 10404 8100 9180
10 96 76 9216 5776 7296
11 100 90 10000 8100 9000
12 96 87 9216 7569 8352
13 110 102 12100 10404 11220
14 99 89 9801 7921 8811
sumatoria 1392 1222 138636 107220 121770
a) ¿ Existe relación lineal entre la TAD basal y la que se observa tras el
tratamiento?

Si existe.
b)¿ Cuál es el valor de TAD esperado tras el tratamiento, en un
paciente que presento una TAD basal de 95 mm Hg?

n ∑ xy − ∑ x ∑ y
𝑏1 =
𝑛 ∑ 𝑥 2 − (∑ 𝑥 )2

∑ x 2 ∑ y − ∑ x ∑ xy
𝑏0 =
𝑛 ∑ 𝑥 2 − (∑ 𝑥 )2

14∗121770 − 1392∗1222 138636∗1222− − 1392∗121770


b1 = 14∗138636−(1392)2
= 1,159 b1 = 14∗138636−(1392)2
= −27,98

y= -27,98 + 1,159*x

LA TAD variara 1,159 dependiendo de la TAD basal.

y= -27,98 + 1,150* 95 = 82,125 mmHg.

12. Se han realizado 9 tomas de presión intracraneal en animales de


laboratorio, por un método estándar directo y por una nueva técnica
experimental indirecta, obteniéndose los resultados siguientes en
mmHg
n=9

__
∑ x =343 ∑ x 2= 17693 x = 38,11
∑xy =16992

__
∑ y =325 ∑ y 2= 16367 y = 36,11

a) Hallar la ecuación lineal que exprese la relación existente entre las


presiones intracraneales, determinadas por los dos métodos.

y   x0 1

n xy   x y 9(16992)  343(325) 41453


  
9(17693)  (343) 2
  0,9968
n x  ( x)
2 2
1 41588

__ __
 0
= y -  x = 36,11- 0,9968. (38,11)=-1,18
1

y = -1,18 + 0,9968x

b) ¿Qué tanto por ciento de la variabilidad de Y es explicada por la


regresión? Hállese el grado de dependencia entre las dos variables y la
varianza residual del mismo.

n xy   x y
r 41453

 
=  0,9914
 n
   x  n y  ( y) 
2 2 2 2
41588.41678
 x 

Determinación r2 = 0,9914

El 99,14 % de la variabilidad de Y es explicada por la recta de regresión

Varianza residual
__ __
X Y y (Y- y) 2

9 6 7,7912 3,208
12 10 10,7816 0,611
28 27 26,7304 0,073
72 67 70,5896 12,885
30 25 28,724 13,868
38 35 36,6984 2,884
76 75 74,5768 0,179
26 27 24,7368 5,122
52 53 50,6536 5,506
__
∑(Y- y) 2 44,336

__
∑(Y− y )2 44,336
S2xy = 𝑛−2
= 9−2
= 6,3337

12. Suponga que a 2 Radiólogos del Programa de Tuberculosis, se les


remiten Radiografías de Toráx de 170 sujetos que están controlados
en una unidad de Neumología, y que se quiere estimar el grado de
Concordancia entre ellos. Los Radiólogos A y B, tiene que clasificar
cada radiografía en una de dos categorías: “positiva” (sospechosa de
lesión tuberculosa) ó “negativas “(no sospechosa de lesión
tuberculosa). Los resultados se muestean a continuación:

RADIÓLOGO A

+ -

RADIÓLOGO + 58 39 97
B
- 12 61 73

70 100 170
 PROPORCIÓN POSITIVA:
B A

97 70

170 170

+= . 170 = 39,94

 PROPORCIÓN NEGATIVA:
B A

100 73

170 170

- = . 170 = 42,94
39,94  42,94
C=
170

C=0,48

o =0

k= 10  0,0,4848

k= - 0,92

Potrebbero piacerti anche