Sei sulla pagina 1di 12

Materia:

Estadística Inferencial y Pronósticos

Unidad 3 Estimación de Intervalos de Confianza


3.1. Definición de estimador y estimación
3.2. Propiedades de los estimadores
3.3. Concepto de intervalo de confianza
3.4. Intervalos de confianza para medias y proporciones
3.5. Tamaño de muestra necesario para la estimación de un intervalo de confianza
Definición de estimador y estimación

Estimador
Es un estadístico de la muestra utilizado para estimar un parámetro poblacional.

Ejemplo
La media de la muestra 𝑥̅ puede ser un estimador de la media de la población µ

Estimador puntual Valor único calculado a partir de una muestra para calcular
un parámetro poblacional. Por ejemplo: si la media de la muestra es de 1 020 psi,
éste constituye el mejor estimador de la fuerza de tensión media de la población.

Estimador de intervalo Intervalo donde probablemente se localiza un parámetro


de población, basado en información de la muestra. Ejemplo: de acuerdo con los
datos de la muestra, la media de la población está en el intervalo entre 1.9 y 2.0 libras.

Tipos de estimadores
Podemos hacer dos tipos de estimaciones concernientes a una población: una
estimación puntual y una estimación de intervalo.

 Una estimación puntual es un solo número que se utiliza para estimar un


parámetro de población desconocido.

Ejemplo: El precio promedio de gasolina en la delegación Tlalpan es de $15.89

 Una estimación de intervalo es un rango de valores que se utiliza para


estimar un parámetro de la población.

Ejemplo: El precio promedio de gasolina en la delegación Tlalpan esta entre


$15.80 y $16.30
En el ejemplo anterior del precio de la gasolina el estimador por intervalo nos
permite minimizar el error de estimación
3.2. Estimación puntual de la media de una población y estimación por intervalo de la
media de una población

Como se mencionó anteriormente una estimación puntual es un valor encontrado de un


determinado evento y una estimación por intervalos será un rango de valores. El siguiente
problema nos permitirá entender mejor estos conceptos.

Ejemplo:

Un distribuidor de refacciones automotrices necesita una estimación de la vida media que


puede esperar de los limpiadores de parabrisas en condiciones normales de manejo. La
administración de la empresa ya ha determinado que la desviación estándar de la vida útil de
la población es 6 meses. Se ha seleccionado una muestra aleatoria de 100 limpiadores con
una media muestral de 21meses. Como el distribuidor utiliza decenas de miles de
limpiadores al año, nos pide que encontremos una estimación de intervalo con un nivel de
confianza del 95%. El tamaño de la muestra es mayor que 30, de modo que el teorema
central del límite nos permite usar la distribución normal como distribución de muestreo, aun
cuando nuestra población no tenga distribución normal.

Datos:
n = 100
𝑥̅ = 21 𝑚𝑒𝑠𝑒𝑠
𝜎 = 6 𝑚𝑒𝑠𝑒𝑠
𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 = 95%

Desarrollo

Calculamos el error estándar

𝜎 6
𝜎𝑥̅ = = 10 = 0.6
√𝑛
Con un nivel de confianza del 95% obtendremos el valor z de la distribución normal la tabla
que se muestra adelante solo cuenta con el 50% de la probabilidad por tal razón el nivel de
confianza se divide entre dos y nos da la probabilidad que está asociada al valor z que
requerimos para determinar el intervalo de estimación.

95
Nivel de confianza = = 47.5 como esta expresado en % lo pasamos a número decimal
2
47.5
dividiéndolo entre dos = 0.475 este valor lo ubicamos en la tabla y el valor de z
100
asociado es de: 1.96
Se suma la columna donde se localizó el numero + la fila es decir 1.9+0.06 = 1.96

Para calcular el intervalo de confianza utilizaremos la siguiente ecuación.

𝑥̅ ± 𝑧𝜎𝑥̅

Donde:

z = valor obtenido de la probabilidad asociada


x̅ = media de la muestra
σx̅ = error estandar

Calculado el límite superior tenemos


x̅ + zσx̅
21 + (1.96)(0.6) =
21 + 1.18 = 22.18 meses

Calculado el límite inferior tenemos

x̅ − zσx̅
21 − (1.96)(0.6)
21 − 1.18 = 19.82 meses

Conclusión

De acuerdo a los resultados obtenidos se estima que la vida media de la población de


limpiadores de parabrisas se encuentra entre 19.82 y 22.18 meses con un 95% de confianza.

3.3. Estimación de la diferencia de dos medias

Sean 𝜇1 la media de la población 1 y 𝜇2 la media de la población 2, lo que interesa aquí son


inferencias acerca de la diferencia entre las medias: 𝜇1 − 𝜇2 . Para hacer una inferencia acerca
de esta diferencia, se elige una muestra aleatoria simple de 𝑛1 unidades de la población 1 y
otra muestra aleatoria simple de 𝑛2 unidades de la población 2.

En el ejemplo siguiente, se muestra cómo calcular el margen de error y obtener una


estimación por intervalo para la diferencia entre las dos medias poblacionales cuando se
conocen σ1 y σ2.

Ejemplo:
Hightmoda, Inc. tiene dos tiendas en Ontario, Canadá, una en el centro de la ciudad y otra en
un centro comercial. El gerente regional ha observado que los productos que se venden bien
en una tienda no se venden bien en la otra. El gerente cree que esto se debe a diferencias
demográficas entre los clientes de las dos tiendas. Debe haber diferencias de edad, educación,
ingreso, etc., entre los clientes de una y otra tienda. Suponga que el gerente pide que se
investigue la diferencia entre las medias de las edades de los clientes de las dos tiendas de
acuerdo con datos de anteriores estudios demográficos sobre los clientes, las dos desviaciones
estándar poblaciones se conocen y son σ1 = 9 años y σ2 = 10 años. De los datos de las dos
muestras aleatorias de los clientes de Hightmoda se obtuvieron los resultados siguientes:

Tienda en el centro Tienda en el


de la ciudad centro comercial

Tamaño de la muestra n1 = 36 n2 = 49

Media muestral x̅ = 40 𝑎ñ𝑜𝑠 x̅ = 35 𝑎ñ𝑜𝑠

Calcule una estimación de intervalo a un nivel de confianza del 95%.

1. Calculamos la diferencia de las medias utilizando la siguiente ecuación

𝜇1 − 𝜇2
40 − 35 = 5 𝑎ñ𝑜𝑠 𝑑𝑒 𝑑𝑖𝑓𝑒𝑟𝑛𝑐𝑖𝑎 𝑑𝑒 𝑒𝑑𝑎𝑑

2. Calculamos el error estándar para la diferencia de medias utilizando la siguiente


ecuación.

𝜎12 𝜎22
𝜎𝑥̅1 −𝑥̅2 =√ +
𝑛1 𝑛2

92 102 81 100
𝜎𝑥̅1 −𝑥̅2 = √ + = √ + = 2.071
36 49 36 49

3. Calculamos el valor de z asociado cuando se establece un nivel de confianza = 95%


95 .95
Se convierte a número decimal 100 = .95 y ahora se divide entre dos 2 = 0.475
Y se localiza en la tabla el valor de z = 1.96

4. Calculamos el intervalo de confianza para la diferencia de medias utilizando la siguiente


ecuación.

𝜇1 − 𝜇2 ± 𝑧𝜎𝑥̅1 −𝑥̅2

 Limite Superior
𝜇1 − 𝜇2 ± 𝑧𝜎𝑥̅1−𝑥̅2
5 + (1.96)( 2.071)

5 + 4.06 = 9.06 años

 Límite Inferior

𝜇1 − 𝜇2 ± 𝑧𝜎𝑥̅1−𝑥̅2

5 − (1.96)( 2.071)

5 + 4.06 = 0.94 años

Conclusión

Con un nivel de confianza de 95% el intervalo estimado para la diferencia de las medias es
de 0.94 años< 𝜇1 − 𝜇2 < 9.06 años

3.4. Inferencias acerca de la diferencia entre dos proporciones poblacionales

Sea p1 una proporción de la población 1 y p2 una proporción de la población 2, a continuación


se considerarán inferencias acerca de la diferencia entre dos proporciones poblacionales: p1-
p2. Para las inferencias acerca de estas diferencias, se seleccionan dos muestras aleatorias
independientes, una de n1 unidades de la población 1 y otra de n2 unidades de la población 2.

Como se ha observado anteriormente una estimación por intervalo está dada por una
estimación puntual ± un margen de error.

La forma general de una estimación por intervalo para la diferencia entre dos proporciones
poblacionales es la siguiente.

𝑝̅1 − 𝑝̅2 ± 𝑧 𝜎𝑝̅1 −𝑝̅2

Ejemplo:

Una empresa que se dedica a elaborar declaraciones de impuestos desea comparar la calidad
del trabajo que se realiza en dos de sus oficinas regionales. Con muestras aleatorias de las
declaraciones de impuestos elaboradas en dichas oficinas y verificando la exactitud de las
declaraciones, la empresa podrá estimar la proporción de declaraciones con errores
elaboradas en cada una de estas oficinas. Se tomó una muestra aleatorias de las dos oficinas
se obtienen los datos siguientes.

Oficina 1 Oficina 2

𝑛1 = 250 𝑛2 = 300

Número de declaraciones con errores = 35 Número de declaraciones con errores =


27

Calcule una estimación de intervalo a un nivel de confianza del 90%.

1. Calculamos las proporciones muéstrales en cada una de las oficinas.

35
𝑝̅1 = = 0.14
250

27
𝑝̅2 = = 0.09
300

2. La estimación puntual de la diferencia entre las proporciones de declaraciones con


errores en las dos poblaciones es:

𝑝̅1 − 𝑝̅2 = 0.14 - 0.09 = 0.05

3. Se calcula el error de la diferencias de la proporción utilizando la siguiente ecuación.

𝑝̅1 (1 − 𝑝̅1 ) 𝑝̅2 (1 − 𝑝̅2 )


𝜎𝑝̅1−𝑝̅2 = √ +
𝑛1 𝑛2

0.14(1 − 0.14) 0.09(1 − 0.09)


= √ +
250 300
0.1204 0.0819
= √ + = 0.0274
250 27

𝜎𝑝̅1−𝑝̅2 = 0.0274

4. Calcular el valor z asociado a un nivel de confianza del 90%

Se convierte el 90 a número decimal y se divide entre dos y se obtiene


0.90
= 0.4500 se localiza el valor de tabla y se obtiene z = 1.64
2

Como el valor a localizar en de 0.4500 y en la tabla podemos observar que el valor más
cercano es de 4495 o 4505 el criterio para seleccionar es arbitrario.

5. Calcular el intervalo de confianza obtenemos:

𝑝̅1 − 𝑝̅2 ± 𝑧 𝜎𝑝̅1−𝑝̅2

0.05 ± (1.64) (0.0274)


0.05 ± 0.045

Límite superior
0.05 + 0.045 = 0.095

Límite inferior
0.05 − 0.045 = 0.005

Conclusión

Con un nivel de confianza de 90% el intervalo estimado para la diferencia de las


proporciones es de 0.005< 𝑝̅1 − 𝑝̅2 < .095

Tamaño de muestra necesario para la estimación de un intervalo de confianza

Tamaño de la muestra para calcular una media poblacional

Para calcular una media poblacional, se puede expresar la interacción entre estos tres factores y el
tamaño de la muestra se expresa con la fórmula siguiente. Note que esta fórmula es el margen de error
que se utiliza para calcular los puntos extremos de los intervalos de confianza para estimar una media
poblacional.

𝝈
𝑬=𝒛
√𝒏
Al despejar n en esta ecuación se obtiene el siguiente resultado:

𝑧𝜎 2
𝑛=( )
𝜀
Donde:

n = es el tamaño de la muestra.
z = es el valor normal estándar correspondiente al nivel de confianza deseado.
σ = es la desviación estándar de la población.
𝜀 = es el error máximo admisible.

Ejemplo:
Un estudiante de administración pública desea determinar la cantidad media que ganan al
mes los miembros de los consejos ciudadanos de las grandes ciudades. El error al calcular la
media debe ser inferior a $100, con un nivel de confianza de 95%. El estudiante encontró un
informe del Departamento del Trabajo en el que la desviación estándar es de $1 000. ¿Cuál
es el tamaño de la muestra que se requiere?

El error máximo admisible, E, es de $100. El valor z de un nivel de confianza de 95% es de


1.96, y el estimador de la desviación estándar, $1 000. Al sustituir estos valores en la fórmula
(9-5) se obtiene el tamaño de la muestra que se requiere:

𝑧𝜎 2 (1.96)(1000) 2
𝑛 = ( 𝜀 ) =( ) = 384.16
100

El valor calculado de 384.16 se redondea a 385. Se requiere una muestra de 385 para
satisfacer las especificaciones. Si el estudiante desea incrementar el nivel de confianza, por
ejemplo, a 99%, se requerirá una muestra más grande.

Tamaño de la muestra para calcular la proporción de una población.

Para determinar el tamaño de la muestra en el caso de una proporción, es necesario


especificar estas mismas tres variables:

1. El margen de error.
2. El nivel de confianza deseado.
3. La variación o dispersión de la población a estudiar.

Donde:

n es el tamaño de la muestra.
z es el valor normal estándar correspondiente al nivel de confianza deseado.
π es la proporción de la población.
E es el máximo error tolerable.

Las elecciones del estadístico z y el margen de error E son las mismas que para
calcular la media poblacional. Sin embargo, en este caso la desviación estándar de la
población de una distribución normal está representada por π (1 - π). Para encontrar
el valor de una proporción de la población, podemos hallar un estudio similar o
conducir un estudio piloto. Si no se puede encontrar un valor confiable, entonces se
debe usar un valor de π de 0.50. Observe que π (1 - π) tiene el mayor valor utilizando
0.50 y, por lo tanto, sin una buena estimación de la proporción de la población, se
sobrestima el tamaño de la muestra. Esta diferencia no afectará el estimador de la
proporción de la población.

En el estudio del ejemplo anterior también se calcula la proporción de ciudades que


cuentan con recolectores de basura privados. El estudiante desea que el margen de
error se encuentre a 0.10 de la proporción de la población; el nivel de confianza
deseado es de 90%, y no se encuentra disponible ningún estimador de la proporción
de la población. ¿Cuál es el tamaño de la muestra que se requiere?

El estimador de la proporción de la población se encuentra a 0.10, por lo que E =


0.10. El nivel de confianza deseado es de 0.90, que corresponde a un valor z de 1.65.
Como no se encuentra disponible ningún estimador de la población, se utiliza 0.50.
El número de observaciones que se sugiere es
2
1.65
𝑛 = (. 5)(1 − .5) (0.10) = 68.0625
El investigador necesita una muestra aleatoria de 69 ciudades.

Potrebbero piacerti anche