Sei sulla pagina 1di 10

INFERENCIA CON DOS MUESTRAS

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS Y LA DIFERENCIA DE PROPORCIONES

En prctica es muy comn enfrentarse al problema de hacer comparaciones. As por ejemplo, al dueo de una empresa le puede interesar saber si el rendimiento de los trabajadores de la jornada diurna es superior al de los trabajadores de la jornada nocturna, o si se observa alguna diferencia en el rendimiento atribuible al gnero del trabajador o si el rendimiento de sus empleados ha sido afectado por el tiempo, ser que son ms eficientes cuando estn recin vinculados?. Como se ve, es muy fcil pensar en situaciones en las que se deben considerar dos poblaciones o en su defecto dos muestras de datos. El tratamiento estadstico al problema de las comparaciones puede hacerse a travs del uso de la inferencia estadstica (recuerde que esto aplica en el caso de no tener acceso a la informacin a nivel poblacional) a travs del uso de Intervalos de Confianza o pruebas de Hiptesis. En esta clase abordaremos la construccin de Intervalos de confianza.

Situaciones a considerar: Muestras Independientes Muestras Dependientes Muestras Pareadas Muestras relacionadas

No existe ninguna relacin entre las dos La muestra est organizada por pares, de tal muestras de datos forma que cada par tiene una relacin o nexo. Muestra 1 Muestra 2 Caso 1: Estudiar una poblaciones diferentes. dos Caso 1: Los mismos individuos o unidades muestrales son medidos en dos puntos del tiempo Ejemplo: Comparacin de dos tratamientos Ejemplo: Dieta para perder peso. Los individuos son pesados antes y despus de Caso 2: Estudiar una variable en una poblacin usar la dieta. pero se discrimina por una variable categrica Caso 2: Hay dos grupos de individuos pero hay Ejemplo: Comparacin por gnero un nexo familiar, laboral, o prescrito por el experimento entre el primer y segundo dato que conforman la pareja. variable en Muestra: n parejas, (xi,yi)

Ejemplo: Salario de la esposa-Salario del esposo Estatura del Padre Estatura del hijo En ensayos clnicos suelen tomarse dos muestras de gemelos para considerar individos con caractersticas similares (misma raza, igual edad, similitud en la condicin fsica, similitud en su perfil socioeconmico, igual escolaridad, etc) para estudiar la evolucin ante un tratamiento. A uno de los gemelos se le administra el tratamiento y al otro ninguno tratamiento (placebo) o el tratamiento alternativo.

Intervalos de Confianza con Muestras Independientes


Supuestos: - Adems de que las muestras sean independientes, stas deben ser aleatorias (no muestras de voluntarios u obtenidas por conveniencia) - La variable en estudio debe distribuirse normalmente en las dos poblaciones consideradas Entonces se supone que la variable X: X~N( ) en la Poblacin 1 y para la Poblacin 2 X~N( ).

Notacin: Parmetro: Estimador:

Tamao de muestra: Distribucin del estimador: ( )

Para calcular el intervalo de confianza para la diferencia de dos medias se debe saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe probar si son iguales o diferentes. Cada uno de estos tres casos se analizarn por separado-

CASO 1 : Varianzas conocidas: CASO 2: Varianzas desconocidas pero iguales CASO 3: Varianzas desconocidas pero desiguales CASO 4: Muestras pareadas Mtodos ms precisos!

NOTA: Para determinar la diferencia entre el caso 2 y el 3 se debe hacer una prueba de hiptesis, tema no visto hasta el momento. CASO 1 : Varianzas conocidas: Frmula para calcular el IC del 1- %:

Error Estndar: Desviacin estndar en la distribucin del estimador. Ejemplo1 : Consumo de energa. Se desea comparar el consumo de energa de dos sectores de la ciudad. Tomando los datos provenientes de una muestra de cada uno de los sectores se tiene que en el Sector 1 se ha observado un consumo promedio de 150 (kWh/mes) en el ltimo trimestre, mientras que en el Sector 2 el consumo promedio ha sido de 171 (kWh/mes). Segn el comportamiento histrico, la varianza en el consumo de energa en cada sector es baja y estable en el tiempo en un valor de 12 (kWh/mes) tanto para el Sector 1 y el 2. El tamao de muestra utilizado fue de 35 hogares en el Sector 1 y 40 hogares en el sector 2. Calcule e interprete el IC del 99% para la diferencia en el consumo promedio de energa entre el sector 2 y 1. Solucin:

CASO 2: Varianzas desconocidas pero iguales

( ( ) ( )

Ejemplo 21. Construya un intervalo de confianza del 94% para la diferencia real entre las duraciones de dos marcas de bombillos, si una muestra de 40 bombillos tomada al azar de la primera marca dio una duracin media de 418 horas, y una muestra de 50 bombillos de otra marca dieron una duracin media de 402 horas. Las desviaciones estndares de las dos poblaciones son 26 horas y 22 horas, respectivamente. Asuma varianzas iguales. Solucin. Tenemos que:, , s1 = 26, s2 = 22, n1 = 40, n2 = 50, Z0.03 = 1.88. El intervalo de confianza

es, entonces: Nota: si ambos lmites resultan positivos, y por lo tanto no contengan el valor cero se interpreta que ambas marcas no tienen la misma duracin media, y la muestra sugiere que la primera marca de bombillos tenga una duracin media superior a la segunda.

Ejemplo 3: Mtodos de Estudio. Se desea comparar el rendimiento obtenido bajo dos mtodos de estudio diferentes. Para tal fin, se seleccion al azar una muestra de 60 estudiantes de un mismo grado de una institucin educativa. Treinta de ellos, seleccionados tambin al azar, utilizaron el mtodo tradicional, los otros treinta utilizaron una nueva estrategia basada en el uso de talleres y tutoras va web. Tras pasar un perodo acadmico usando la estrategia asignada, se tomo registro del rendimiento de los estudiantes obtenindose la informacin contenida en la tabla. Resuelva asumiendo varianzas iguales.
Mtodo Tamao de Muestra Media muestral Desviacin Estndar Muestral

Tradicional Nuevo

25 25

3.4

http://www.mitecnologico.com/Main/IntervaloConfianzaParaDiferenciaEntreDosMedias

CASO 3: Varianzas desconocidas y desiguales


Si las varianzas poblacionales no pueden suponerse iguales los lmites del intervalo de confianza son:

El valor crtico t

/2 corresponde a una distribucin t cuyos grados de libertad se calculan en base a ambos

tamaos muestrales y a las desviaciones tpicas de cada grupo segn la correccin propuesta por Dixon y Massey:

Ejemplo 4: La condicin ser zurdo o derecho afecta la rapidez al escribir? Dos muestras aleatorias de estudiantes son seleccionadas, se les pide que escriban un texto. A juzgar por el IC del 95%, hay diferencia en la rapidez media entre estos dos grupos? Resuelva asumiendo varianzas diferentes.

Group - handed n

right

16 55.8 5.7

left

59.3 4.3

Caso 4: Intervalos de Confianza para Muestras Pareadas

denota la cuasivarianza muestral de la diferencia dada por:

Ejemplo 5: Use los siguientes datos2 para hallar el IC del 95% para la diferencia media de peso al finalizar la dieta, interpretarlo. Tabla 1. Datos de 75 pacientes con sobrepeso sometidos a dos dietas alimenticias.
Dieta A Peso inicial 94,07 Peso final 86,59 Dieta B Peso inicial 88,02 Peso final 84,12

96,79

93,08

88,22

86,13

92,15

87,85

103,45

101,21

92,30

86,83

82,94

79,08

96,50

92,70

89,71

86,19

83,11

76,80

94,83

91,93

http://www.fisterra.com/mbe/investiga/t_student/t_student.asp#Tabla 1

91,16

83,40

81,93

78,97

90,81

86,74

83,41

78,89

81,37

77,67

73,59

69,76

89,81

85,70

108,47

104,20

84,92

79,96

72,67

70,01

84,43

79,80

96,84

93,66

86,33

81,15

88,48

87,00

87,60

81,92

89,57

87,24

81,08

76,32

85,22

82,09

92,07

90,20

103,76

102,24

81,14

73,34

87,84

84,66

96,87

93,58

91,50

88,95

99,59

92,36

93,04

88,73

83,90

77,23

92,14

88,07

89,41

85,45

85,26

81,36

85,31

84,59

89,42

86,64

89,25

84,89

92,42

88,99

93,20

93,10

93,13

89,73

89,17

86,87

80,86

77,81

93,51

86,36

88,75

85,93

88,85

83,24

95,02

91,90

88,40

81,20

92,29

91,28

82,45

77,18

89,43

87,22

96,47

88,61

93,32

89,77

99,48

94,67

92,88

89,38

99,95

93,87

89,88

88,00

100,05

94,15

82,25

80,81

87,33

82,17

88,99

86,87

87,61

86,01

82,07

79,74

89,28

83,78

89,72

83,56

95,57

89,58

97,71

91,35

98,73

97,82

Caso 4: Muestras pareadas o muestras relacionadas o muestras dependientes:


Ejemplo 6: Un mdico desea investigar si una droga tiene el efecto de bajar la presin sangunea en los usuarios. El mdico eligi al azar 15 pacientes mujeres y les tom la presin luego les recet la medicina por un periodo de 6 meses, y al final del mismo nuevamente les tom la presin. Los resultados son como siguen: Antes 70 80 72 76 76 76 72 78 82 64 74 92 74 68 84 Despus 68 72 62 70 58 66 68 52 64 72 74 60 74 72 74 Es efectiva la droga?

En estos casos el parmetro que se estudia el parmetro D: Verdadera diferencia media En SPSS se introducen las dos muestras una en cada columna y luego se utiliza AnalizarComparar Medias-Prueba T para muestras relacionadas y luego seleccionar las dos variables:

La slida en pantalla es
Es tadsticos de m ue s tras r elacionadas Media 75,87 67,07 N 15 15 Desv iacin tp. 6,865 6,670 Error tp. de la media 1,772 1,722

Par 1

Antes Despus

Cor relaciones de mues tras relacionadas N Par 1 Antes y Des pus 15 Correlacin -,315 Sig. ,253

Prue ba de m ues tras relacionadas Dif erencias relac ionadas 95% Intervalo de conf ianz a para la dif erencia Inf erior Superior 2,722 14,878

Par 1

Antes - Despus

Media 8,800

Desv iacin tp. 10,975

Error tp. de la media 2,834

t 3,105

gl 14

Sig. (bilateral) ,008

Este es el valor de d
Los resultados a la derecha se usan para prueba hacer una prueba de hiptesis, observe algo importante del IC, ste no contiene el cero, contiene slo valores positivos quiere decir entonces que la presin sangunea no rebajo por el contrario parece que eleva un poco las medidas.

Intervalos de Confianza para la diferencia de Proporciones Ejemplo 7: 300 hombres y 400 mujeres fueron encuestados sobre su opinin acerca de una nueva ley aprobada en el senado. 75 de los hombres y 90 de las mujeres manifestaron una opinin positiva frente a la nueva ley. Hallar e interpretar el IC del 90% para la diferencia de proporciones. Interprtelo!

Potrebbero piacerti anche