Sei sulla pagina 1di 16

ESTADÍSTICA INFERENCIAL

Cardenas Naranjo Maria Hesney


Toscano Morantes Janeth
Rincón Luengas Marcela
Cuchala Burbano Adriana del Pilar

DESARROLLO DEL TRABAJO COLABORATIVO

PARTE 1 Y 2

presentado al Docente:
Moreno Sarmiento Efrain

Institución Universitaria Politécnico Grancolombiano


Facultad de Ingeniería
Programa Estadística Inferencial
Subgrupo 40
Bogotá DC.
2018
INTRODUCCIÓN

Esta asignatura ha sido orientada a entender los principios en los que se basa la estadística
inferencial, lo primero que debemos tener en cuenta son las razones para determinar dicho
cálculo. De ahí partiremos para analizar cada uno de los puntos de vista de cada integrante
y su versión ante el problema, en muchos casos, distintas personas perciben diferentes
conclusiones de los mismos datos. En nuestro caso, cualquier solución debe ser sólida ante
el problema expuesto. Desde este punto de vista, nuestra tarea es poder entender los
argumentos estadísticos y también poder construirlos nosotros mismos.
Objetivo General

Lograr a través de este trabajo establecer inferencias acerca de una población, con base
en la información contenida en una muestra, adquiriendo la comprensión a través de datos.

Objetivos Específicos

● Poner en práctica los temas trabajados en el modulo de Estadistica Inferencial.


● Llevar a cabo la utilización adecuada de la herramientas dadas por el docente
fórmulas y utilización excel; en un muestreo enfocado en un diseño de un
experimento sencillo y la recolección de datos de manera apropiada.
SOLUCIÓN AL TRABAJO COLABORATIVO

PARTE 1 EJERCICIO 1

1​.Tamaño de muestra para propiedad de vehículos motorizados A usted lo contrató la Ford


Motor Company para hacer investigación de mercado, por lo que debe estimar el porcentaje
de hogares que poseen un vehículo. ¿Cuántos hogares debe entrevistar si desea tener una
confianza del 94% de que su porcentaje muestral tiene un margen de error de tres puntos
porcentuales?

a. Suponga que un estudio previo sugiere que el 86% de los hogares poseen
vehículos.

b. Suponga que no hay información disponible que pueda usarse para estimar el
porcentaje de hogares en los que poseen un vehículo.

c. Suponga que en lugar de utilizar hogares que se seleccionaron al azar, los datos
muestrales se obtienen pidiendo a los lectores del periódico Washington Post que
envíen por correo un formato de encuesta. ¿De qué forma se afectan los resultados?

SOLUCIÓN

EJERCICIO 1
a. Suponga que un estudio previo sugiere que el 86% de los hogares poseen
vehículos.
Lo primero hacemos es identificar la fórmula que debe aplicar para resolver el caso:
fórmula
Donde

Z = nivel de confianza = 94%

p = proporción esperada = 86% = 0,86

q= Probabilidad de fracaso o error = 14% = 0,14

E= Precisión = 0.03

El valor​ Z ​se puede hallar con la ayuda de la tabla de distribucion normal estandar

buscando el valor del 97% o 0,97, para un nivel de confianza del 94%. Como se encuentra
el valor exacto 0,970 = 1,88, como se muestra la imagen.

a. Estudio previo sugiere que el 86% de los hogares poseen vehículos entonces
tenemos:

Despejar formula

Respuesta

n= 473 hogares se deben entrevistar para obtener resultados con un nivel de confianza de
94% y un margen de error de 0,003

b. Suponga que NO hay información disponible que pueda usarse para estimar el
porcentaje de hogares en los que poseen un vehículo.
fórmula

Donde

Z = nivel de confianza = 94%

p = proporción esperada = ​Desconocida

q= Probabilidad de fracaso o error = ​Desconocida

E= Precisión = 0.03

El valor​ Z ​se puede hallar con la ayuda de la tabla de distribucion normal estandar

buscando el valor del 97% o 0,97, para un nivel de confianza del 94%. Como se encuentra
el valor exacto 0,970 = 1,88, como se muestra la imagen.

NOTA:

Para hallar el tamaño de la muestra desconociendo p q

p= es la proporción de elementos que posee la característica de interés esto se


representa con 0, 5 cuando se desconocen la proporción y q seria 1-p que sería

1-0,5 = 0,5
Respuesta

n= 982 hogares se deben entrevistar para obtener resultados con un nivel de confianza de
94% y un margen de error de 0,003 y desconociendo la proporción esperada.

c. Suponga que en lugar de utilizar hogares que se seleccionaron al azar, los datos
muestrales se obtienen pidiendo a los lectores del periódico Washington Post que
envíen por correo un formato de encuesta. ¿De qué forma se afectan los resultados?

Respuesta

Teniendo en cuenta que que la solicitud sólo llegaría a los lectores del periódico Washington
Post ​c​omo los datos muestrales se obtienen de forma voluntaria, esto no permitiría tener
una validez en los resultados y de esta forma plantear una ecuación con datos reales.
Adicional consideramos este tipo de muestra es errónea a razón que este método de
muestreo arruina la muestra, llevándola a estar sesgada por otra parte no se está dando la
importancia de la aleatoriedad el cual permite tener un muestreo real, al tratarse de un
muestreo voluntario las posibles respuestas no serían representativas de toda la población.
Generando conclusiones erradas debida a su muestra sesgada, cuando la muestra se da
por respuestas voluntarias se debe encaminar su conclusión al grupo especifico que decidió
participar, pero si se diera la conclusión para una población más grande estaríamos
errados; es decir no se tiene la esencia de la estadística la cual es la aleatoriedad a una
población ya definida, con datos reales, es decir que esta muestra no se podría utilizar para
datos generales, por lo anterior no podríamos tener los resultados deseados con este
sistema.

PARTE 1 EJERCICIO 2

1. ​A usted lo acaba de contratar la división de mercadeo de General Motors, para estimar la


media de la cantidad de dinero que se gasta ahora en la compra de automóviles nuevos en
Estados Unidos. Primero use la regla práctica del intervalo para hacer un estimado burdo de
la desviación estándar de las cantidades que se gastan. Es razonable suponer que el rango
típico de cantidades va desde $12,000 hasta $70,000. Luego use esa desviación estándar
estimada para determinar el tamaño de muestra correspondiente a un nivel de confianza del
95% y a un margen de error de $100. ¿Es práctico el tamaño de muestra? Si no es así,
¿qué se debe cambiar para obtener un tamaño de muestra práctico?

​SOLUCIÓN
Desviación estándar en este caso lo hallamos por medio las cantidades razonables que van
desde un valor máximo de 70.000 a un valor de mínimo 12.000
R = Vmax - Vmin = 70000 -12000 = 58000
R =58000
Datos los cuales tenemos para despejar las dudas según el enunciado
σ =58000
E =100
Z(α/2 ) = ​1,96, este valor es hallado en la tabla de distribución
Nivel de confianza 95 % ​= 0,9750, valor que se aproxima

tabla de distribución

Se halla el tamaño de la muestra despejando la siguiente fórmula


Para obtener el nivel de confianza del 95%, el tamaño de la muestra debe ser de 1.292.267
¿Es práctico el tamaño de muestra? Si no es así, ¿qué se debe cambiar para obtener un
tamaño de muestra práctico?

Respuesta

No es muy práctico el tamaño de la muestra ya que es muy grande o alto y debería


incrementarse el margen de error.

PARTE 2 EJERCICIO 1:

Pulso: Una doctora quiere desarrollar criterios para determinar si el pulso de un paciente es
anormal y determinar si hay diferencias significativas entre hombres y mujeres. Utilice la
Base de datos ​https://goo.gl/rV7QsE , dentro de esta ubique la hoja de cálculo llamada Base
Datos 1. Responda a las siguientes preguntas dado los datos anteriores.

a. Construya un estimado del intervalo de confianza del 95% de la media del pulso
para hombres.
b. Construya un estimado del intervalo de confianza del 95% de la media del pulso
para mujeres.
c. Compare los resultados anteriores. ¿Es posible concluir que las medias
poblacionales para hombres y para mujeres son diferentes? ¿Por qué?

SOLUCIÓN
a. Construya un estimado del intervalo de confianza del 95% de la media del pulso
para hombres.

Lo primero que debemos realizar es realizar la separación de datos de hombre el cual


quedará así:

Segundo ya seleccionada nuestra población. Esta es la que utilizaremos en la recolección


de datos para evaluar nuestra hipótesis. Y utilizaremos la siguiente fórmula:

una vez identificada la fórmula consolidamos los datos con los que contamos para el
desarrollo:

DATOS:

X = a la suma de las pulsacione: 2776


n = es el total de la población: 40

Ahora vamos vamos a despejar la formula:

= ​2776 ​ = 69,4
40
Luego realizamos el despeje de la desviación estándar de la muestra la cual quedará así:
= 11,1552678139075​ ​≈11,16 a dos décimas.

Como sabemos nuestro ​intervalo de confianza del 95%, por lo anterior procedemos hallar el
valor crítico, o Za/2, Convierte el porcentaje a un número decimal 0,95, restalo de 1 (1 –
0,095) y divídelo entre 2 para tener 0,025. Luego, revisa la tabla de valores para encontrar
el valor que corresponde a 0,025. Verás que el valor más cercano es -1,96 en la
intersección de la fila 1,9 y la columna 0,6.

Lego calculamos el error estándar: toma la desviación estándar 11,16 y la dividimos entre
la raíz cuadrada del tamaño de la muestra la cual es de 40 la cual quedará así:

Ahora multiplicamos 1,96 por 1,76 (el valor crítico por el error estándar) para obtener
3,4496; este es el margen de error.

Por último expresamos nuestro intervalo de confianza, para esto simplemente tenemos que
tomar el promedio o la media que en este caso es (69,4), y escribirla al lado de ± y el
margen de error. La respuesta es: 69,4 ± 3,45. Puedes encontrar los límites superior e
inferior del intervalo de confianza, sumando y restando el margen de error a la media.
Entonces los límites para hombre serán los siguientes:

· límite inferior es 69,4 – 3,45 = 65,95


· límite superior es 69,4 + 3,45 = 72,85
Resultados en Excel se adjunta hoja de cálculos.

b. Construya un estimado del intervalo de confianza del 95% de la media del pulso
para mujeres.

nivel de confianza = 95%


media =76,3
desviación estándar= 12,56
Tamaño de la muestra = 40
z= 1,96
Alfa = 5%
Formula para hallar intervalo de confianza 1 y 2

x+-z*ds/raíz(n)
Despejando fórmula
76,3 - 1,96 *12,56/raiz de 40 = 72,41 primer intervalo de confianza límite inferior
76,3 + 1,96 *12,56/raiz de 40 = 80,19 segundo intervalo de confianza límite superior.

Para calcular el valor crítico de la muestra de tamaño primero debemos hallar el número de
grados de libertad el cual se utiliza la siguiente fórmula , teniendo los grados de libertad
buscamos este número en la tabla de Distribución t: Valores críticos t, con una confianza del
95%, correspondiente al 0.05 para dos colas.

tabla de Distribución

Donde;
Margen de error para mujeres

FÓRMULA

DESPEJAR

E = 3,98276509

Ya teniendo estos datos podemos hallar intervalo de pulsaciones para mujeres

Donde;

La media = 76,3

Margen de error= 3,982765

72,30472343 80,2982765709

a un entero de la muestra

Resultados en Excel se adjunta hoja de cálculos.


c. Compare los resultados anteriores. ¿Es posible concluir que las medias
poblacionales para hombres y para mujeres son diferentes? ¿Por qué?

En el ejercicio planteado vemos que, tanto la estimación puntual de la media de la variable


pulsaciones en hombres y mujeres (69,4 vs 76,3) como sus intervalos de confianza (65,94
– 72,86 en el grupo de hombres vs 72,41 – 80,19 en el grupo de mujeres) esta
diferenciados o distantes por mas o menos por 3.01 que diríamos que es el margen de
error; por lo que es altamente improbable que las variables de género y pulsaciones estén
relacionadas en la población (lo que conlleva a que las pulsaciones tomadas en ambas
poblaciones fueran muy diferentes), decir pudieron influir la edad, actividad anterior en el
momento de toma del pulso, la posición entre otros.

MEDIA LÍMITE LÍMITE


INFERIOR SUPERIOR

MUJERES 76,3 65,94 72,86

HOMBRES 69,4 72,43 80,17


En este orden de ideas podemos identificar que tantos las mujeres como los hombres en los
límites superior de las mujeres es el límite inferior de los hombres, son muy parecidos los
datos por lo sus promedios se pueden cruzar como se observa en la gráfica.

CONCLUSIONES

● El módulo nos permite poner en práctica el estudio del comportamiento y


propiedades de una muestra para poder generar resultados de un estudio de
situaciones y dar respuesta a un problema de una forma útil.

● Con la herramientas de excel dadas por el docente pudimos realizar un estudio con
varios datos a la vez; simulando situaciones que en nuestra vida diaria facilita el
control de procesos y la verificación de las posibles respuestas reduciendo costos en
las empresa a razón que podríamos ir anticipadamente a la solución del problema.

Potrebbero piacerti anche