Sei sulla pagina 1di 6

Determinación del tamaño de muestra

Sea la variable aleatoria X ~ N( 𝜇𝑋 , 𝜎𝑋2 ), este modelo está representando la distribución de los y su
varianza es  X2 , pero realmente, no se conoce ni la distribución de los datos, ni la media, ni la
varianza de los datos de la variable X.

Sea la variable aleatoria 𝑋̅ ~ N(𝜇𝑋̅ , 𝜎𝑋2̅ )


Consideremos el siguiente evento:
P(µ - k𝜎𝑋̅ < 𝑋̅ < µ + k𝜎𝑋̅ ) = ɣ (a) 𝑥̅1

P( - k𝜎𝑋̅ < 𝑋̅ − µ < k𝜎𝑋̅ ) = ɣ (b)

𝑋̅− µ
P( - k < < k) = ɣ (c)
𝜎𝑋̅

P( - k < 𝑍̅ < k ) = ɣ (d)

El evento involucrado en “b” en palabras es: que el valor de la media muestral se aleje de la media
poblacional en menos de k veces la desviación estándar de la media muestral, que también podría
decirse, el valor de la media muestral se aleje de la media poblacional en menos de una cantidad
“E”.
De la observación de la gráfica tenemos: 𝑥̅1 = µ + k𝜎𝑋̅ ( e )
A la igualdad ( e ) restémosle la media µ entonces:
𝑥̅1 - µ = µ + k𝜎𝑋̅ - µ

𝑥̅1 - µ = k𝜎𝑋̅

De esto tenemos que:



E  k X  k X
  n
k 2  X2
A partir de la última expresión tenemos que: n 
E2
Donde:

- k: es el valor de Z que se obtiene para la probabilidad ɣ según “d”.


- ɣ: Esta probabilidad cuantifica la ocurrencia del evento “ qué el valor de la media muestral
difiera de la poblacional en menos de una cantidad E”
- E: Es la cantidad que el investigador o especialista espera, que a lo más, el valor de la media
muestral difiera de la poblacional.
-  X2 : Es la varianza de los datos poblacionales. Respecto al valor de la varianza, pueden darse
dos situaciones:
1. Que el investigador o especialista tenga alguna idea de la dispersión de los datos.
2. Que no sepa nada de la dispersión, en este caso, se selecciona entre 5 a 10 individuos de la
población y en cada uno de ellos se mide la variable, se obtienen los datos y a partir de
estos se calcula la varianza.

LIC. MARIA A. ZACARÍAS DÍAZ 60


Ejemplo
La directora de un colegio particular, año a año incrementa el montó de la pensión de pago por
enseñanza. Para hacer este incremento, debe tener información respecto del ingreso medio del
padre de familia de todos los alumnos, como no lo conoce va hacer una estimación del ingreso
medio, tomando una muestra de padres de familia, por lo que previamente debe determinar el
tamaño de muestra. Por información anterior, sabe que la variabilidad de los ingresos respecto a la
media es de 70 nuevos soles (  X ), además espera, que el ingreso medio muestral difiera del ingreso
medio poblacional en menos de 10 nuevos soles y desea que eso ocurra con una probabilidad 0.95.
Solución
E = 10  X = 70  = 0.95 entonces k = 1.96
Luego n = (1.96)2(4900) / 100 = 188.2384

Estimación de Parámetros por Intervalos de Confianza.

Consiste en conseguir un intervalo de valores posibles en la que se considera que se encuentra


el valor del parámetro. Asociado a este intervalo se tiene la probabilidad,  , de que el
intervalo contenga al parámetro  .
Esto es: P  A    B   
A  se le llama nivel de confianza y se fija de antemano. Los niveles de confianza  , más
usados son 0.95 y 0.99.
 también se expresa de la siguiente manera   1   , a  se le llama nivel de
significación, y los valores más usados de  son : 0.05 y 0.01.

INTERVALOS DE CONFIANZA BASADOS EN LA DISTRIBUCIÓN NORMAL

A. Intervalo de confianza para la media de una población Normal con Varianza


Poblacional  X2 , conocida

Sea X una v. a. con distribución normal con media  X desconocida y varianza  X2


conocida. Supongamos que deseamos un intervalo de confianza de la media poblacional al
100(1 -  ) %
X
Sabemos que la variable Z  N(0, 1)
X n
Consideremos la siguiente proposición probabilística:
1    P(  z /2  Z  z /2 )
 X  
= P   z / 2  2  z / 2 

 X / n 
 X X 
= P   z / 2  X    z / 2 
 n n 

LIC. MARIA A. ZACARÍAS DÍAZ 61


 X X 
= P  X  z / 2    X  z / 2 
 n n 
Donde - z / 2
es el valor de la distribución normal estándar asociada a la probabilidad de la
cola inferior de  / 2 .
X X
Luego el intervalo es: x  z / 2    x  z / 2 (a)
n n
X
O lo que es lo mismo x  E , donde , E el margen de error es E  z / 2
n

Interpretación de los intervalos de clase.


Si se extraen repetida e independientemente muestras aleatorias de n datos de la población,
en un elevado número, y se calculan intervalos de confianza al 100(1 -  ) % mediante la
ecuación (a), entonces, 100(1 -  ) % de estos intervalos contendrá el verdadero valor de la
media poblacional.
A los valores z / 2 , se les llama a veces factor de fiabilidad, correspondiente a algunos niveles
de confianza, así:

Nivel de confianza 90% 95% 98% 99%


 0.1 0.05 0.02 0.01
z / 2 1.645 1.96 2.33 2.58

Ejemplo.
Un proceso produce bolsas de azúcar refinado. El peso del contenido de estas bolsas sigue
una distribución normal que tiene una desviación típica de 12 gramos. De la producción de
un día se selecciona una muestra aleatoria de 25 bolsas, se pesa cada una de ellas y se obtiene
el peso medio siendo éste 198 gramos. Halle el límite superior de confianza y el límite inferior
del intervalo de confianza al 99 por ciento del verdadero peso medio de todas las bolsas de
azúcar producidas por el proceso.

Solución.
UO. Bolsa de azúcar de la producción de un día de una fábrica.
Conjunto de UO: Todas las bolsas producidas en un día. Constituyen toda la población.
X: Peso de la bolsa de azúcar.
La distribución de los datos del peso de las bolsas de azúcar se supone que es normal y se
sabe que su desviación estándar o típica  X es de 12 gr., pero no se conoce el peso medio
 X de la producción del día.
Se obtendrá una estimación por intervalos para el peso medio  X de las bolsas de azúcar de
toda la población, para ello se seleccionó una muestra aleatoria de 25 bolsas.

En el caso del intervalo de confianza al 99 por ciento, tenemos que:


 el factor de fiabilidad donde  / 2  0.005 , es z0.005  2.58 ,
 la media muestral obtenida a partir de una muestra de tamaño n=25 es x = 198
gr.
LIC. MARIA A. ZACARÍAS DÍAZ 62
Los límites de confianza son:
X 12
LI  x  z / 2  198  2.58  191.808
n 25

X 12
LS  x  z / 2  198  2.58  204.192
n 25
Interpretación, el intervalo (191.808, 204.192) contiene al peso medio de las bolsa de
azucar de la producción de un día con un 99 % de confianza.

B. Intervalo de confianza para la media de una población Normal con Varianza


Poblacional  X2 , desconocida

Caso I. Muestras de tamaño menor que 30 ( n < 30 )


Se supone que la v.a. X que tiene distribución N   X ,  X2  donde  X y  X2 son
desconocidos.
Supongamos que deseamos un intervalo de confianza de la media poblacional al 100(1 -  )
%
S S
Luego el intervalo es: I = X  t 2 , X  t 2
n n

Donde:
- t / 2 es el valor de la distribución “t” asociada a la probabilidad de la cola inferior de
 / 2 , es decir: P(t '  t / 2 )   / 2
f(q)

-5 0 5
q
2

 X 
n

i X
i 1
S =
n 1

Ejemplo
Un fabricante de fibras desea estimar la media de la tensión de ruptura de una fibra. Diseña
un experimento para medir la tensión de ruptura en 6 fibras que fueron seleccionadas de la
producción de un día. Los resultados de la medición de la tensión son: 20.8, 20.6, 21.0,
20.9, 19.9, 20.2.
Construya un intervalo de confianza del 98% para el valor real de la tensión de ruptura media
de la fibra.

Solución.
LIC. MARIA A. ZACARÍAS DÍAZ 63
UO: Fibra producida en un día en una fábrica.
Conjunto de unidades de observación: Todas las fibras producidas en un día, constituyen la
población.
X: tensión de ruptura.
Se supone X ~ N(µ, 𝜎2 ) ambos parámetros desconocidos
Se desea estimar  X , y como el valor de la varianza no se conoce y el tamaño de muestra es
menor de 30, se calcula los límites del siguiente intervalo.

S S
X  t 2 , X  t 2
n n

Se calcula el valor de X y de S usando los datos muestrales, siendo estos:


x = 20.56 s2 = 0.1866 s = 0.432

Se halla el factor de fiabilidad  t0.001 , P(t '  t 0.001 )  0.001   t 0.001   3.365

 0.43 0.43 
Luego I =  20.56  3.365 , 20.56  3.365 
 2.449 2.449 
I = ( 19.97 , 21.16)

Interpretación.
El intervalo (19.97 , 21.16) contiene el valor de la media de la tensión de ruptura de todas
las fibras sintéticas producidas en un día con un 98% de confianza.

Caso II. Muestras de tamaño superior o igual a 30.


El intervalo es:
S S
I= X  z 2 , X  z 2 es el intervalo de confianza para  X con un nivel de
n n
confianza  .

Ejemplo.
En una muestra aleatoria de 81 alumnos, de una Universidad, en quienes se midió su CI, se
obtuvo el CI medio igual a 112 y una desviación estándar de 10. Obtenga un intervalo de
confianza para el coeficiente intelectual medio de todos los alumnos de la Universidad, donde
 = 0.99.
Solución.
UO: Alumno de una universidad.
Conjunto de UO: Constituida por todos los alumnos de la Universidad matriculados en
determinado Periodo académico.
Muestra: Se tomó una muestra aleatoria de 81 alumnos.
Variable poblacional de interés, X: Coeficiente intelectual.

LIC. MARIA A. ZACARÍAS DÍAZ 64


No se conoce la distribución de probabilidades de X pero suponemos que es N   X ,  X2 
donde  X y  X2 son desconocidos.
Se tiene como información un valor de la media muestral, x = 112 y un valor de la
desviación estándar muestral s = 10, es decir se tiene una estimación puntual para cada uno
de los parámetros. Como lo que se desea estimar es  X es decir la media del coeficiente
intelectual de todos alumnos, dado que el valor 112 no nos dice cuan cerca o lejos estará del
verdadero valor de  X , tampoco se tiene un nivel de confianza, por ello se obtendrá una
estimación por intervalos.

Solución
Se remplazan los valores de X y S, luego el intervalo es:
10 10
112  2.576    112  2.576
81 81
I = (109.424 , 114.576 )

Interpretación.
El Coeficiente Intelectual Medio de todos los alumnos de la Universidad esta contenido en
el intervalo (109.424 , 114.576 ) con un nivel de confianza de 99%.

LIC. MARIA A. ZACARÍAS DÍAZ 65

Potrebbero piacerti anche