Sei sulla pagina 1di 11

INFERENCIA PARA UNA POBLACIÓN

Intervalos de confianza y contrastes para la media y la proporción.

-1. Ejercicio.
a-Sobre el conjunto de datos Galton, hemos realizado el intervalos de confianza al 95% para
la media de la estura en cm:

One Sample t-test

data: estatura_cm
t = 495.25, df = 399, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
171.9173 173.2877
sample estimates:
mean of x
172.6025

Observamos que el intervalo de confianza al 95% de la media de la estatura se encuentra entre


171,92 y 173,29 y que la media estimada de x es 172,6

b. Contrasta la hipótesis de que la estatura media no supera 173cm al 1% de significación.

H0: estatura media es igual o mayor a 173


H1: estatura media es inferior a 173

One Sample t-test

data: factor_estatura_cm
t = -0.79031, df = 399, p-value = 0.2149
alternative hypothesis: true mean is less than 173
99 percent confidence interval:
-Inf 173.5388
sample estimates:
mean of x
172.7244

Con un nivel de significación de 1% el valor p encontrado es de 0.21, por lo que no podemos


rechazar H0 y concluimos que la estatura media no es inferior a 173.

c-Sobre el conjunto de datos Galton también realizamos un intervalo con un nivel de


confianza del 99% para la proporción de marineros que son solteros.

Frequency counts (test is for first level):


ESTADO
Soltero Casado
350 50
1-sample proportions test without continuity correction

data: rbind(.Table), null probability 0.5


X-squared = 225, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.5
99 percent confidence interval:
0.8261956 0.9115669
sample estimates:
p
0.875

Observamos que al 99% de confianza el intervalo de la proporción de solteros se encuentra entre


82.55 y 91.1%.

d- Contrasta la hipótesis de que la proporción de marineros que son solteros no llega a ser el
90%.

H0= proporción de marineros solteros es del 90% o mayor


H1= la proporción de marineros es menor solteros del 90%

1-sample proportions test without continuity correction

data: rbind(.Table), null probability 0.9


X-squared = 2.7778, df = 1, p-value = 0.04779
alternative hypothesis: true p is less than 0.9
95 percent confidence interval:
0.0000000 0.8997051
sample estimates:
p
0.875

Con un nivel de significación de 5% el valor p encontrado es de 0.04, por lo que rechazamos H0 y


concluimos que la proporción de marineros solteros es menor del 90%.

-2. Un indicador de exclusión toma valores de 5 a 10. Se selecciona una muestra aleatoria de
15 personas de cierta población.

a. Comprueba que la distribución de los datos es normal mediante el gráfico de comparación


de cuantiles.

Gráfica de comparación de cuantiles:


8 .2 8
14

8 .2 6
8 .2 4
n o ta

8 .2 2
8 .2 0

13

-1 0 1

n o r m q u a n t i le s

b. Calcula un intervalo de confianza al 95% para la media del indicador en la población


general.

Hemos realizado un nuevo conjunto de datos en el cual hemos metido los valores que se nos daban
de acuerdo a los datos del indicador de exclusión. Al calcular el intervalo de confianza al 95% para
la media del del indicador en la población general nos ha aparecido lo siguiente:

One Sample t-test

data: nota
t = 1260.6, df = 14, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
8.21999 8.24801
sample estimates:
mean of x
8.234

Con un intervalo de confianza al 95%, la media del indicador estaría entre el 8.22 y 8.25

c. Contrasta si se puede aceptar que la media es 8.20 con un nivel de significación 0.05

H0: la media es igual 8.20


H1: la media es distinta de 8.20
data: nota
t = 5.2052, df = 14, p-value = 0.0001333
alternative hypothesis: true mean is not equal to 8.2
95 percent confidence interval:
8.21999 8.24801
sample estimates:
mean of x
8.234

Con un nivel de confianza del 95% el valor p encontrado es de 0.0001333, por lo que se rechaza
H0 y no podemos decir que la media es de 8.2

-3. Una muestra aleatoria de 500 consumidores de vino participaron en un cata de vinos
promovida por la marca “Bodega”. En la cata solo uno de los vinos era de esta marca. Cuando
se les preguntó cuál era el vino preferido de todos los catados, 180 de ellos eliegieron el de esta
marca.

a. Proporciona un intervalo de confianza al 95% para que represente la probabilidad de que


un consumidor elija este vino.

Hemos calculado el intervalo de confianza al 95%, en el caso de la cata de vino introduciendo la


tabla para un ejemplo simple, estableciendo 180 éxitos y 320 fracasos.

1-sample proportions test without continuity correction

data: rbind(.Table), null probability 0.5


X-squared = 39.2, df = 1, p-value = 3.825e-10
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.3191414 0.4029934
sample estimates:
p
0.36

Así establece que el intervalo de confianza al 95% estaría entre 0,32 y 0,40.

b. Efectúa el contraste con hipótesis alternativa de que el porcentaje de consumidores que


eligen este vino es mayor del 35%.

H0: el porcentaje de consumidores es igual o menor al 35%


H1: el porcentaje de consumidores es mayor al 35%
1-sample proportions test without continuity correction

data: rbind(.Table), null probability 0.35


X-squared = 0.21978, df = 1, p-value = 0.3196
alternative hypothesis: true p is greater than 0.35
95 percent confidence interval:
0.3255317 1.0000000
sample estimates:
p
0.36

Con un nivel de confianza del 95% el valor p encontrado es de 0.3196 , por lo que no se puede
rechazar H0 y no podemos decir que el porcentaje de consumidores de este vino es mayor al 35%.

c. ¿Cuántos catadores deberán participar a la prueba para obtener un intervalo de


confianza al 95% con un error máximo de 0.02?

Z2(α) = 3.84
ε= 0.02
p= 0.35
n=2184

4- Se estudia la proporción de individuos con cargas familiares en un colectivo específico. Un


modelo sugiere que esta proporción es mayor que 1/3. Se hace un análisis en una muestra
aleatoria de 300 individuos, la cual da como resultado 130 tienen cargas familiares.

a. Construye un intervalo de confianza al 95% y establece conclusiones.

1-sample proportions test without continuity correction

data: rbind(.Table), null probability 0.5


X-squared = 5.3333, df = 1, p-value = 0.02092
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.3784513 0.4899011
sample estimates:
p
0.4333333

Vemos con los datos de arriba, que al 95% de probabilidad el intervalo de confianza de la
proporción con cargas familiares de esta muestra se situaría entre 0.38 y 0.49. Por otra parte, el
modelo en esta muestra estima una proporción de el 0,433, lo cual es mayor que la proporción
estimada en un comienzo (1/3).
b. ¿Qué tamaño muestral hubiera sido necesario para mantener el margen de error pero
aumentar el nivel de confianza al 99%?

Z2(α) = 2.582
ε=
p= 0.35
Para calcular el tamaño muestral, es necesario conocer el error (que se
tiene que mantener), desde el ejercicio anterior (alpha al 5%).
ε= ¿?
α = 0.05
Z2(α) = 1.962
p= 0.43
n=300
e=Z ( α )
√ p ( 1− p )
n
e=1.96
√ 0.43 ( 0.57 )
300
e=0.178
Ahora, para calcular el estimado de la muestra, emplearemos el mismo
valor del error, pero aumentamos el nivel de confiana (99%).
n= ¿?
α = 0.01
Z2(α) = 2.582
p= 0.43
e=0.178

n=51
Por tanto, se concluye que para mantener el nivel de error y aumentar la
confiabilidad, la muestra estimada sería de 51 participantes.

c . Efectúa el contraste de hipótesis correspondiente planteando como hipótesis alternativa la


sospecha del enunciado. Asume alpha= 0,05

H0: La proporción de familias con cargas es igual o menor que 1/3


H1: La proporción de familias con cargas supera 1/3

1-sample proportions test without continuity correction


data: rbind(.Table), null probability 0.33
X-squared = 14.488, df = 1, p-value = 7.052e-05
alternative hypothesis: true p is greater than 0.33
95 percent confidence interval:
0.3870773 1.0000000
sample estimates:
p
0.4333333

Con un nivel de confianza del 95% el valor p encontrado es de 7.052e-05 , por lo que se puede
rechazar H0 y se concluye que el porcentaje de familias con cargas supera 1/3

d. También se pide estimar con intervalo al 99% de confianza la proporción de individuos


con problemas de salud mental. Se sabe que no superará el 20% pero no se conoce
exactamente la prevalencia. En la misma muestra han aparecido 40 con problemas de
este tipo.

1-sample proportions test without continuity correction

data: rbind(.Table), null probability 0.2


X-squared = 8.3333, df = 1, p-value = 0.001946
alternative hypothesis: true p is less than 0.2
99 percent confidence interval:
0.0000000 0.1855456
sample estimates:
p
0.1333333

Vemos con los datos de arriba, que al 99% de probabilidad el intervalo de confianza de la
proporción de personas con problemas de salud mental de esta muestra se situaría entre 0 y 0.18 Por
otra parte, el modelo en esta muestra estima una proporción de 0.133, lo cual iría en la misma línea
de lo que se esperaba (menor al 20%)

e. ¿Qué tamaño muestral hubiera sido necesario si en el apartado anterior hubiéramos exigido
un margen de error máximo del 2%?

n= ¿?
α = 0.01
Z2(α) = 2.582
p= 0.1333
e= 0.02
n=0.1155311* 16.641
n=2

INTERVALOS DE CONFIANZA PARA SUBGRUPOS Y GRÁFICOS DE LOS


INTERVALOS

Imagina que los datos de trabajadores forman una muestra aleatoria de un sector.
Intervalos de confianza para las medias siguientes:

a- De la variable edad de los trabajadores del sector.

data: Edad
t = 69.88, df = 473, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
37.09549 39.24207
sample estimates:
mean of x
38.16878

Con un nivel de confianza del 95% se estima que la media de la edad de los trabajores estará entre
los 37.09549 y 39.24207 años.

b- De la variable edad de los trabajadores varones del sector.

One Sample t-test

data: empleados$Edad[empleados$sexo == "hombre"]


t = 59.396, df = 257, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
36.28668 38.77533
sample estimates:
mean of x
37.53101

Con un nivel de confianza del 95% se estima que la media de la edad de los trabajores varones
estará entre los 36.28668 y 38.77533 años

c- De la variable edad para mujeres de minoría étnica en el sector.

Welch Two Sample t-test

data: Edad and (sexo == "mujer" & minoría == "minoría_étnica")


t = 69.706, df = 473.52, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
37.01081 39.15797
sample estimates:
mean of x mean of y
38.16877637 0.08438819

Con un nivel de confianza del 95% se estima que la media de la edad de las trabajadoras
pertenecientes a una minoría étnica. estará entre los 37.01 y 39.16 años

d-Representa en un gráfico los intervalos para el salario medio factorizado por sexo.

P lo t o f M e a n s
40000
m e a n o f s a la rio

35000
30000
25000

h o m b re m u je r

se xo

Atendiendo a la gráfica, se observa que el salario medio de los hombres es mayor que el de las
mujeres.

2. Contrasta si puede creerse que el salario es superior a 34mil $ en el sector.


H0: que el salario es igual o menor a 34000
H1: que es salario es superio a 34000

data: salario
t = 0.53495, df = 473, p-value = 0.2965
alternative hypothesis: true mean is greater than 34000
95 percent confidence interval:
33126.96 Inf
sample estimates:
mean of x
34419.57

Con una confianza del 95% el valor p es de 0.29, con lo que no se rechaza H0 y se concluye que el
salario medio no es superior a 34000$.

3. Según un informe, al menos un 1/3 de los trabajadores en el sector son de minorías étnicas.
Haz el estudio con un contraste y un intervalo.
H0: al menos un tercio son de minorías étnicas
H1: menos de un tercio son de minorías étnicas

1-sample proportions test without continuity correction

data: rbind(.Table), null probability 0.333


X-squared = 27.536, df = 1, p-value = 7.712e-08
alternative hypothesis: true p is less than 0.333
95 percent confidence interval:
0.0000000 0.2522199
sample estimates:
p
0.2194093

Con un nivel de confianza al 95%, el intervalo encontrado es de 0 a 0.25 y un valor p menor que
0.05, por lo que rechazamos H0 y concluimos que menos de un tercio de trabajadores pertenecen a
minorías étnicas. La proporción estimada de esta muestra es que el 21,9% pertenecen a minorías
étnicas.

4. Haz estudios similares que tengan sentido.

– Ejemplo: Según un informe más del 50% de los trabajadores son hombres. Haz el estudio
con un contraste y un intervalo.

H0: la proporción de hombres es mayor al 50%


H1: la proporción de hombres es menor o igual al 50%
1-sample proportions test without continuity correction

data: rbind(.Table), null probability 0.5


X-squared = 3.7215, df = 1, p-value = 0.9731
alternative hypothesis: true p is less than 0.5
95 percent confidence interval:
0.000000 0.581573
sample estimates:
p
0.5443038

Con un nivel de confianza al 95%, el intervalo de confianza para proporción de hombres va del 0 al
58,15% con un valor p de 0,97, por lo que no rechazamos H0 y concluimos que la proporción de
hombres en el sector supera el 50%.

Potrebbero piacerti anche