Sei sulla pagina 1di 58

DISTRIBUCIONES DISCRETAS (BINOMINAL)

En estadstica, la distribucin binomial es una distribucin de probabilidad discreta que cuenta el nmero de
xitos en una secuencia de n ensayos de Bernoulli independientes entre s, con una probabilidad fija p de
ocurrencia del xito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser dicotmico, esto es,
slo son posibles dos resultados. A uno de estos se denomina xito y tiene una probabilidad de ocurrencia p y
al otro, fracaso, con una probabilidad q = 1 - p. En la distribucin binomial el anterior experimento se
repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado nmero de
xitos. Para n = 1, la binomial se convierte, de hecho, en una distribucin de Bernoulli.
Para representar que una variable aleatoria X sigue una distribucin binomial de parmetros n y p, se escribe:

La distribucin binomial es la base del test binomial de significacin estadstica.
ndice
[ocultar]
1 Ejemplos
2 Experimento binomial
3 Caractersticas analticas
o 3.1 Ejemplo
4 Propiedades
5 Relaciones con otras variables aleatorias
6 Propiedades reproductivas
7 Referencias
8 Enlaces externos
Ejemplos[editar]
Las siguientes situaciones son ejemplos de experimentos que pueden modelizarse por esta distribucin:
Se lanza un dado diez veces y se cuenta el nmero X de tres obtenidos: entonces X ~ B(10, 1/6)
Se lanza una moneda dos veces y se cuenta el nmero X de caras obtenidas: entonces X ~ B(2, 1/2)
Experimento binomial[editar]
Existen muchas situaciones en las que se presenta una experiencia binomial. Cada uno de los
experimentos es independiente de los restantes (la probabilidad del resultado de un experimento no
depende del resultado del resto). El resultado de cada experimento ha de admitir slo dos categoras (a las
que se denomina xito y fracaso). Las probabilidades de ambas posibilidades han de ser constantes en
todos los experimentos (se denotan como p y q o p y 1-p).
Se designa por X a la variable que mide el nmero de xitos que se han producido en los n experimentos.
Cuando se dan estas circunstancias, se dice que la variable X sigue una distribucin de probabilidad
binomial, y se denotaB(n,p).
Caractersticas analticas[editar]
Su funcin de probabilidad es

donde
siendo las combinaciones de en ( elementos tomados de en )
Ejemplo[editar]
Supongamos que se lanza un dado (con 6 caras) 50 veces y queremos conocer la probabilidad de que
el nmero 3 salga 20 veces. En este caso tenemos una X ~ B(50, 1/6) y la probabilidad sera P(X=20):

Propiedades[editar]


Relaciones con otras variables aleatorias[editar]
Si tiende a infinito y es tal que el producto entre ambos parmetros tiende a ,
entonces la distribucin de la variable aleatoria binomial tiende a una distribucin de
Poisson de parmetro .
Por ltimo, se cumple que cuando =0.5 y n es muy grande (usualmente se exige
que ) la distribucin binomial puede aproximarse mediante la distribucin normal.
Propiedades reproductivas[editar]
Dadas n variables binomiales independientes de parmetros n
i
(i = 1,..., n) y , su suma es
tambin una variable binomial, de parmetros n
1
+... + n
n
, y , es decir,

Distribucin binomial

Funcin de probabilidad

Funcin de distribucin de probabilidad
Parmetros nmero de ensayos (entero)
probabilidad de xito
(real)
Dominio

Funcin de
probabilidad(fp)

Funcin de
distribucin(cdf)

Media

Mediana
Uno de
1

Moda

Varianza

Coeficiente de
simetra

Curtosis

Entropa

Funcin
generadora de
momentos(mgf)

Funcin
caracterstica


BINOMINAL
Distribucin binomial

Una distribucin binomial o de Bernoulli ti ene l as si guientes caracter sti cas:
1. En cada prueba del experi mento slo son posi bl es dos
resultados: xito y fracaso.
2.La probabilidad de xito es constante, es deci r, que no var a de una prueba a
otra. Se representa por p.
3.La probabilidad de fracaso tambi n es constante, Se representa por q,
q = 1 p
3.El resultado obtenido en cada prueba es independiente de l os resul tados
obtenidos anteri ormente.
5.La variable aleatoria binomial , X, expresa el nmero de xitos obtenidos en
l as n pruebas. Por tanto, l os val ores que puede tomar X son: 0, 1, 2, 3, 4, ..., n.
La distribucin bimomial se expresa por B(n, p)


Clculo de probabilidades en una distribucin binomial

n es el nmero de pruebas.
k es el nmero de xitos.
p es l a probabi l idad de xi to.
q es l a probabi l idad de fracaso.
El nmero combi natori o


Ejemplo
La l ti ma novel a de un autor ha tenido un gran xi to, hasta el punto de que el 80%
de l os l ectores ya l a han l eido. Un grupo de 4 ami gos son afi ci onados a l a l ectura:
1. Cul es l a probabil i dad de que el grupo hayan l ei do l a novela 2 personas?
n = 4
p = 0.8
q = 0.2
B(4, 0.8)

2.Y cmo mxi mo 2?




Parmetros de la distribucin binomial
Media

Varianza

Desviacin tpica

Ejemplo
La probabi l idad de que un art cul o produci do por una fabri ca sea defectuoso es
0.02. Se envi un cargamento de 10.000 art cul os a unos al macenes. Hal l ar el nmero
esperado de art cul os defectuosos, l a varianza y l a desvi aci n t pi ca.




BINOMINAL
La Distribucin Binomial
B (n, p)

FUNCIONES DE PROBABILIDAD:
Llamamos funcin de probabilidad f a la aplicacin de E(X) (Espacio Muestral) en el intervalo [0,1] que verifica:
f(A) = p(A)
Bsicamente se trata de estudiar la probabilidad como una funcin utilizando para su estudio todas las
propiedades de las funciones.

LA DISTRIBUCIN BINOMIAL:
Llamamos experiencia aleatoria dicotmica a aquella que slo puede tener dos posibles resultados A y A'.
Usualmente A recibe el nombre de xito, adems representaremos como p = p(A) y q = 1-p=p(A').
A la funcin de probabilidad de una variable aleatoria X resultado de contar el nmero de xitos al
repetir n veces una experiencia aleatoria dicotmica con probabilidad de xito p la llamamos distribucin
binomial y la representamos por
B (n, p)
Para esta distribucin se verifica que, la variable X puede tomar los valores:
0, 1, 2, ... , n
y que la variable toma cada uno de estos valores con probabilidad:

(debers repasar las propiedades de los nmeros combinatorios antes de continuar).
Ejercicio 1:
En la escena siguiente modifica los valores de n y de p para ver cmo se modifican las probabilidades de los
distintos posibles valores de p (X=r)
(si se te superponen los decimales ve modificando el parmetro hasta que los veas con claridad)

Ejercicio 2:
Lanzamos 5 veces una moneda no trucada, Cul es la probabilidad de que obtengamos exactamente 2 caras?
(X = n de caras en 5 lanzamientos. B (5, 0,5))
Comprueba el resultado obtenido con tu calculadora en la escena anterior haciendo n = 5 y p = 0,5 para el
valor de r =2.
Ejercicio 3:
En un juego de azar la probabilidad de ganar una mano es 0,8. Calcula la probabilidad de que un jugador que
juega 10 manos las gane todas y la probabilidad de que gane al menos 8.
Utiliza la escena de la actividad 1 para comprobar los resultados
Ejercicio 4:
Respondemos al azar a un test de 8 preguntas, cada una de las cuales tiene 4 opciones (solo una de ellas es
verdadera). Para aprobar necesitamos contestar correctamente al menos a 6 de ellas. Cul es la probabilidad
de aprobar?. Y la probabilidad de fallar las 8?.
Utiliza la escena de la actividad 1 para comprobar los resultados.

PARMETROS DE UNA DISTRIBUCIN BINOMIAL:
Esperanza:
n p
Desviacin tpica:
(n p q)
0.5
(raz cuadrada)

AJUSTE DE UNA SERIE DE DATOS A UNA DISTRIBUCIN BINOMIAL:
Disponemos de una serie de k datos que toman los valores 0, 1, ... ,n.
Para saber si estos datos siguen pueden aproximarse por una distribucin binomial:
1. Calculamos la media de los k datos y la igualamos a la Esperanza terica de la Binomial (n p).
Despejamos de aqu el valor de p.
2. Calculamos los valores tericos de p (X = r), multiplicndolos por k para obtener los valores tericos de
cada posible valor de la variable aleatoria en series de k datos.
3. Si la diferencia es "suficientemente pequea" aceptamos como buena la aproximacin Binomial, si no,
la rechazamos.
(nota: la fundamentacin estadstica que nos permitira decidir de manera objetiva si la diferencia entre los
datos tericos y los reales es "suficientemente pequea" escapa de los objetivos de esta unidad didctica, con
lo cual la decisin se deber tomar de manera subjetiva).
Ejercicio 5:
Lanzamos 5 chinchetas y observamos el nmero de ellas que caen con la punta hacia arriba.
Al repetir la experiencia 350 veces obtenemos:
n de puntas hacia arriba 0 1 2 3 4 5
n de veces en los 350 lanzamientos 60 133 101 45 10 1
Ajustan los resultados a una distribucin Binomial? Cul sera el valor de p en caso afirmativo?
Comprueba el resultado obtenido con lpiz y papel con la siguiente escena. Cambia el valor de p y observa
cmo varan los valores tericos, intenta conseguir el ajuste ptimo y comprubalo con los resultados
obtenidos aplicando el procedimiento descrito en este apartado.

Ejercicio 6:
Comprueba ahora si ajusta a una distribucin binomial el nmero de CD's defectuosos encontrados en cajas
de 3 unidades al abrir 100 de dichas cajas:
n de CD's defectuosos 0 1 2 3
n de veces 65 25 10 0

BINOMINAL
Problemas de distribucin binomial


Ejercicio 1





Ejercicio 2





Ejercicio 3





Ejercicio 4




Distribucin de Poisson
Distribucin de Poisson

El eje horizontal es el ndice k. La funcin solamente est definida en
valores enteros de k. Las lneas que conectan los puntos son solo
guas para el ojo y no indican continuidad.
Funcin de probabilidad

El eje horizontal es el ndice k.
Funcin de distribucin de probabilidad
Parmetros

Dominio

Funcin de
probabilidad(fp)

Funcin de
distribucin(cdf)
(dnde es
laFuncin gamma incompleta)
Media

Mediana

Moda

Varianza

Coeficiente de
simetra

Curtosis

Entropa

Funcin
generadora de
momentos(mgf)

Funcin
caracterstica

En teora de probabilidad y estadstica, la distribucin de Poisson es una distribucin de
probabilidaddiscreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que
ocurra un determinado nmero de eventos durante cierto perodo de tiempo. Concretamente, se especializa
en la probabilidad de ocurrencia de sucesos con probabilidades muy pequeas, o sucesos "raros".
Fue descubierta por Simon-Denis Poisson, que la dio a conocer en 1838 en su trabajo Recherches sur la
probabilit des jugements en matires criminelles et matire civile (Investigacin sobre la probabilidad de los
juicios en materias criminales y civiles).
ndice
[ocultar]
1 Propiedades
2 Intervalo de confianza
3 Relacin con otras distribuciones
o 3.1 Sumas de variables aleatorias de Poisson
o 3.2 Distribucin binomial
o 3.3 Aproximacin normal
o 3.4 Distribucin exponencial
4 Ejemplos
5 Procesos de Poisson
6 Enlaces externos
7 Referencias
8 Vase tambin
Propiedades[editar]
La funcin de masa o probabilidad de la distribucin de Poisson es

donde
k es el nmero de ocurrencias del evento o fenmeno (la funcin nos da la probabilidad de que el evento
suceda precisamente k veces).
es un parmetro positivo que representa el nmero de veces que se espera que ocurra el fenmeno
durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4 veces por
minuto y estamos interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10
minutos, usaremos un modelo de distribucin de Poisson con = 104 = 40.
e es la base de los logaritmos naturales (e = 2,71828...)
Tanto el valor esperado como la varianza de una variable aleatoria con distribucin de Poisson son iguales a .
Los momentos de orden superior son polinomios de Touchard en cuyos coeficientes tienen una
interpretacin combinatorio. De hecho, cuando el valor esperado de la distribucin de Poisson es 1, entonces
segn la frmula de Dobinski, el n-simo momento iguala al nmero de particiones de tamao n.
La moda de una variable aleatoria de distribucin de Poisson con un no entero es igual a , el mayor de los
enteros menores que (los smbolos representan la funcin parte entera). Cuando es un entero positivo,
las modas son y 1.
La funcin generadora de momentos de la distribucin de Poisson con valor esperado es

Las variables aleatorias de Poisson tienen la propiedad de ser infinitamente divisibles.
La divergencia Kullback-Leibler desde una variable aleatoria de Poisson de parmetro
0
a otra de parmetro
es

Intervalo de confianza[editar]
Un criterio fcil y rpido para calcular un intervalo de confianza aproximada de es propuesto por Guerriero
(2012).
1
Dada una serie de eventos k (al menos el 15 - 20) en un periodo de tiempo T, los lmites del intervalo
de confianza para la frecuencia vienen dadas por:


entonces los lmites del parmetro estn dadas por: .
Relacin con otras distribuciones[editar]
Sumas de variables aleatorias de Poisson[editar]
La suma de variables aleatorias de Poisson independientes es otra variable aleatoria de Poisson cuyo
parmetro es la suma de los parmetros de las originales. Dicho de otra manera, si

son N variables aleatorias de Poisson independientes, entonces
.
Distribucin binomial[editar]
La distribucin de Poisson es el caso lmite de la distribucin binomial. De hecho, si los
parmetros n y de una distribucin binomial tienden a infinito (en el caso de 'n') y a cero (en
el caso de ) de manera que se mantenga constante, la distribucin lmite obtenida
es de Poisson.
Aproximacin normal[editar]
Como consecuencia del teorema central del lmite, para valores grandes de , una variable
aleatoria de Poisson X puede aproximarse por otra normal dado que el cociente

converge a una distribucin normal de media nula y varianza 1.
Distribucin exponencial[editar]
Supngase que para cada valor t > 0, que representa el tiempo, el nmero de sucesos de cierto
fenmeno aleatorio sigue una distribucin de Poisson de parmetro t. Entonces, los tiempos
transcurridos entre dos sucesos sucesivos sigue la distribucin exponencial.
Ejemplos[editar]
Si el 2% de los libros encuadernados en cierto taller tiene encuadernacin defectuosa, para
obtener la probabilidad de que 5 de 400 libros encuadernados en este taller tengan
encuadernaciones defectuosas usamos la distribucin de Poisson. En este caso concreto, k es 5
y, , el valor esperado de libros defectuosos es el 2% de 400, es decir, 8. Por lo tanto, la
probabilidad buscada es

Este problema tambin podra resolverse recurriendo a una distribucin binomial de
parmetros k = 5, n = 400 y =0,02.
Procesos de Poisson[editar]
Artculo principal: Proceso de Poisson
La distribucin de Poisson se aplica a varios fenmenos discretos de la naturaleza (esto es,
aquellos fenmenos que ocurren 0, 1, 2, 3,... veces durante un periodo definido de tiempo o
en un rea determinada) cuando la probabilidad de ocurrencia del fenmeno es constante en
el tiempo o el espacio. Ejemplos de estos eventos que pueden ser modelados por la
distribucin de Poisson incluyen:
El nmero de autos que pasan a travs de un cierto punto en una ruta (suficientemente
distantes de los semforos) durante un periodo definido de tiempo.
El nmero de errores de ortografa que uno comete al escribir una nica pgina.
El nmero de llamadas telefnicas en una central telefnica por minuto.
El nmero de servidores web accedidos por minuto.
El nmero de animales muertos encontrados por unidad de longitud de ruta.
El nmero de mutaciones de determinada cadena de ADN despus de cierta cantidad de
radiacin.
El nmero de ncleos atmicos inestables que se han desintegrado en un determinado
perodo.
El nmero de estrellas en un determinado volumen de espacio.
La distribucin de receptores visuales en la retina del ojo humano.
La inventiva de un inventor a lo largo de su carrera.

DISTRIBUCION DE POISSON
DISTRIBUCIN DE POISSON.

Caractersticas:
En este tipo de experimentos los xitos buscados son expresados por unidad de rea, tiempo, pieza, etc,
etc,:
- # de defectos de una tela por m
2

- # de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc, etc.
- # de bacterias por cm
2
de cultivo
- # de llamadas telefnicas a un conmutador por hora, minuto, etc, etc.
- # de llegadas de embarcaciones a un puerto por da, mes, etc, etc.
Para determinar la probabilidad de que ocurran x xitos por unidad de tiempo, rea, o producto, la frmula
a utilizar sera:


donde:
p(x,
= media o promedio de xitos por unidad de tiempo, rea o producto
= 2.718
x = variable que nos denota el nmero de xitos que se desea que ocurra

Hay que hacer notar que en esta distribucin el nmero de xitos que ocurren por unidad de tiempo, rea o
producto es totalmente al azar y que cada intervalo de tiempo es independiente de otro intervalo dado, as
como cada rea es independiente de otra rea dada y cada producto es independiente de otro producto
dado.



Ejemplos:
1. Si un banco recibe en promedio 6 cheques sin fondo por da, cules son las probabilidades de que
reciba, a) cuatro cheques sin fondo en un da dado, b) 10 cheques sin fondos en cualquiera de dos
das consecutivos?


Solucin:
a) x = variable que nos define el nmero de cheques sin fondo que llegan al banco en un da
cualquiera = 0, 1, 2, 3, ....., etc, etc.
= 6 cheques sin fondo por da
= 2.718




b)
x= variable que nos define el nmero de cheques sin fondo que llegan al banco en dos das
consecutivos = 0, 1, 2, 3, ......, etc., etc.
= 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das consecutivos
Nota: siempre debe de estar en funcin de x siempre o dicho de otra forma, debe hablar de
lo mismo que x.



2. En la inspeccin de hojalata producida por un proceso electroltico continuo, se identifican 0.2
imperfecciones en promedio por minuto. Determine las probabilidades de identificar a) una
imperfeccin en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando ms una
imperfeccin en 15 minutos.
Solucin:
a) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 3 minutos =
0, 1, 2, 3, ...., etc., etc.
= 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata




b) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 5 minutos =
0, 1, 2, 3, ...., etc., etc.
= 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata



=1-(0.367918+0.367918) = 0.26416

c) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 15 minutos
= 0, 1, 2, 3, ....., etc., etc.
= 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata



= 0.0498026 + 0.149408 = 0.1992106

POISSON
Distribucin de Poisson (o de los sucesos raros)
Una v.a. X posee una ley de distribucin de probabilidades del tipo
Poisson cuando

Este tipo de leyes se aplican a sucesos con probabilidad muy baja de ocurrir, obtenindose como la
distribucin lmite de una sucesin de variable binomiales, , donde , y (por tanto
).




La demostracin de esto consiste en



En general utilizaremos la distribucin de Poisson como aproximacin de experimentos binomiales donde el
nmero de pruebas es muy alto, pero la probabilidad de xito muy baja. A veces se suele utilizar como criterio
de aproximacin:




La ley de Poisson la podemos encontrar tabulada en la tabla nmero 2, para ciertos valores usuales de .
La funcin caracterstica de es




de lo que se deduce que valor esperado y varianza coinciden


6.4.12.1 Ejemplo
Cierta enfermedad tiene una probabilidad muy baja de ocurrir, p=1/100.000. Calcular la probabilidad de que
en una ciudad con 500.000 habitantes haya ms de 3 personas con dicha enfermedad. Calcular el nmero
esperado de habitantes que la padecen.
Solucin: Si consideramos la v.a. X que contabiliza el nmero de personas que padecen la enfermedad, es
claro que sigue un modelo binomial, pero que puede ser muy bien aproximado por un modelo de Poisson, de
modo que




As el nmero esperado de personas que padecen la enfermedad es . Como , existe
una gran dispersin, y no sera extrao encontrar que en realidad hay muchas ms personas o menos que
estn enfermas. La probabilidad de que haya ms de tres personas enfermas es:


DISTRIBUCION CONTINUA
CURVA NORMAL
Distribuciones continuas: Normal (III): Ejercicios

Ejercicio 1: La renta media de los habitantes de un pas es de 4 millones de ptas/ao, con una varianza de 1,5.
Se supone que se distribuye segn una distribucin normal. Calcular:
a) Porcentaje de la poblacin con una renta inferior a 3 millones de ptas.
b) Renta a partir de la cual se sita el 10% de la poblacin con mayores ingresos.
c) Ingresos mnimo y mximo que engloba al 60% de la poblacin con renta media.
a) Porcentaje de la poblacin con una renta inferior a 3 millones de ptas.
Lo primero que tenemos que hacer es calcular la normal tipificada:

(*) Recordemos que el denominador es la desviacin tpica ( raz cuadrada de la varianza)
El valor de Y equivalente a 3 millones de ptas es -0,816.
P (X < 3) = P (Y < -0,816)
Ahora tenemos que ver cul es la probabilidad acumulada hasta ese valor. Tenemos un problema: la tabla de
probabilidades (ver leccin 35) slo abarca valores positivos, no obstante, este problema tiene fcil solucin,
ya que la distribucin normal es simtrica respecto al valor medio.
Por lo tanto:
P (Y < -0,816) = P (Y > 0,816)
Por otra parte, la probabilidad que hay a partir de un valor es igual a 1 (100%) menos la probabilidad
acumulada hasta dicho valor:
P (Y > 0,816) = 1 - P (Y < 0,816) = 1 - 0,7925 (aprox.) = 0,2075
Luego, el 20,75% de la poblacin tiene una renta inferior a 3 millones ptas.
b) Nivel de ingresos a partir del cual se sita el 10% de la poblacin con renta ms elevada.
Vemos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el 0,9 (90%), lo que quiere
decir que por encima se sita el 10% superior.
Ese valor corresponde a Y = 1,282 (aprox.). Ahora calculamos la variable normal X equivalente a ese valor de la
normal tipificada:

Despejando X, su valor es 5,57. Por lo tanto, aquellas personas con ingresos superiores a 5,57 millones de ptas.
constituyen el 10% de la poblacin con renta ms elevada.
c) Nivel de ingresos mnimo y mximo que engloba al 60% de la poblacin con renta media
Vemos en la tabla el valor de la variable normalizada Y cuya probabilidad acumulada es el 0,8 (80%). Como
sabemos que hasta la media la probabilidad acumulada es del 50%, quiere decir que entre la media y este
valor de Y hay un 30% de probabilidad.
Por otra parte, al ser la distribucin normal simtrica, entre -Y y la media hay otro 30% de probabilidad. En
definitiva, el segmento (-Y, Y) engloba al 60% de poblacin con renta media.
El valor de Y que acumula el 80% de la probabilidad es 0,842 (aprox.), por lo que el segmento viene definido
por (-0,842, +0,842). Ahora calculamos los valores de la variable X correspondientes a estos valores de Y.
Los valores de X son 2,97 y 5,03. Por lo tanto, las personas con ingresos superiores a 2,97 millones de ptas. e
inferiores a 5,03 millones de ptas. constituyen el 60% de la poblacin con un nivel medio de renta.

Ejercicio 2: La vida media de los habitantes de un pas es de 68 aos, con una varianza de 25. Se hace un
estudio en una pequea ciudad de 10.000 habitantes:
a) Cuntas personas superarn previsiblemente los 75 aos?
b) Cuntos vivirn menos de 60 aos?
a) Personas que vivirn (previsiblemente) ms de 75 aos
Calculamos el valor de la normal tipificada equivalente a 75 aos

Por lo tanto
P (X > 75) = (Y > 1,4) = 1 - P (Y < 1,4) = 1 - 0,9192 = 0,0808
Luego, el 8,08% de la poblacin (808 habitantes) vivirn ms de 75 aos.
b) Personas que vivirn (previsiblemente) menos de 60 aos
Calculamos el valor de la normal tipificada equivalente a 60 aos

Por lo tanto
P (X < 60) = (Y < -1,6) = P (Y > 1,6) = 1 - P (Y < 1,6) = 0,0548
Luego, el 5,48% de la poblacin (548 habitantes) no llegarn probablemente a esta edad.

Distribucin de probabilidad continua

Una distribucin de probabilidad continua, la distribucin normal.
En teora de la probabilidad una distribucin de probabilidad se llama continua si su funcin de
distribucin es continua. Puesto que la funcin de distribucin de una variable aleatoria X viene dada
por , la definicin implica que en una distribucin de probabilidad continua X se
cumple P[X = a] = 0 para todo nmero real a, esto es, la probabilidad de que X tome el valora es cero para
cualquier valor de a. Si la distribucin de X es continua, se llama a X variable aleatoria continua.
En las distribuciones de probabilidad continuas, la distribucin de probabilidad es la integral de la funcin de
densidad, por lo que tenemos entonces que:

Mientras que en una distribucin de probabilidad discreta un suceso con probabilidad cero es imposible,
no se da el caso en una variable aleatoria continua. Por ejemplo, si se mide la anchura de una hoja de
roble, el resultado 3,5 cm es posible, pero tiene probabilidad cero porque hay infinitos valores posibles
entre 3 cm y 4 cm. Cada uno de esos valores individuales tiene probabilidad cero, aunque la probabilidad
de ese intervalo no lo es. Esta aparente paradoja se resuelve por el hecho de que la probabilidad de
que Xtome algn valor en un conjunto infinito como un intervalo, no puede calcularse mediante la adicin
simple de probabilidades de valores individuales. Formalmente, cada valor tiene una
probabilidad infinitesimal que estadsticamente equivale a cero.
Existe una definicin alternativa ms rigurosa en la que el trmino "distribucin de probabilidad continua"
se reserva a distribuciones que tienen funcin de densidad de probabilidad. Estas funciones se llaman, con
ms precisin, variables aleatorias absolutamente continuas (vase el Teorema de Radon-Nikodym). Para
una variable aleatoria X absolutamente continua es equivalente decir que la probabilidad P[X = a] = 0 para
todo nmero real a, en virtud de que hay un incontables conjuntos de medida de Lebesgue cero (por
ejemplo, elconjunto de Cantor).
Una variable aleatoria con la distribucin de Cantor es continua de acuerdo con la primera definicin, pero
segn la segunda, no es absolutamente continua. Tampoco es discreta, ni una media ponderada de
variables discretas y absolutamente continuas.
En aplicaciones prcticas, las variables aleatorias a menudo ofrece una distribucin discreta o
absolutamente continua, aunque tambin aparezcan de forma natural mezclas de los dos tipos.
Definicin[editar]
Para una variable continua hay infinitos valores posibles de la variable y entre cada dos de ellos se pueden
definir infinitos valores ms. En estas condiciones no es posible deducir la probabilidad de un valor
puntual de la variable; como se puede hacer en el caso de variables discretas, pero es posible calcular la
probabilidad acumulada hasta un cierto valor (funcin de distribucin de probabilidad), y se puede
analizar como cambia la probabilidad acumulada en cada punto (estos cambios no son probabilidades sino
otro concepto: lafuncin de densidad.
En el caso de variable continua la distribucin de probabilidad es la integral de la funcin de densidad, por
lo que tenemos entonces que:

Sea una variable continua, una distribucin de probabilidad o funcin de densidad de probabilidad
(FDP) de es una funcin tal que, para cualesquiera dos nmeros y siendo .



La grfica de se conoce a veces como curva de densidad, la probabilidad de que tome un
valor en el intervalo es el rea bajo la curva de la funcin de densidad; as, la funcin mide
concentracin de probabilidad alrededor de los valores de una variable aleatoria continua.

rea bajo la curva de entre y

Para que sea una FDP ( ) legtima, debe satisfacer las siguientes dos
condiciones:

1. 0 para toda .

2.

Ya que la probabilidad es siempre un nmero positivo, la FDP es una funcin no
decreciente que cumple:

1. . Es decir, la probabilidad de todo el espacio muestral es 1.

2. . Es decir, la probabilidad del suceso nulo es cero.

Algunas FDP estn declaradas en rangos de a , como la de
la distribucin normal.

DISTRIBUCION NORAMAL

Los grficos de probabilidad normal constituyen otra importante herramienta grfica para comprobar si un
conjunto de datos puede considerarse o no procedente de una distribucin normal. La idea bsica consiste en
enfrentar, en un mismo grfico, los datos que han sido observados frente a los datos tericos que se
obtendran de una distribucin gaussiana. Si la distribucin de la variable coincide con la normal, los puntos se
concentrarn en torno a una lnea recta, aunque conviene tener en cuenta que siempre tender a observarse
mayor variabilidad en los extremos (Figura 4a, datos del peso). En los grficos P-P se confrontan las
proporciones acumuladas de una variable con las de una distribucin normal. Los grficos Q-Q se obtienen de
modo anlogo, esta vez representando los cuantiles respecto a los cuantiles de la distribucin
normal. Adems de permitir valorar la desviacin de la normalidad, los grficos de probabilidad permiten
conocer la causa de esa desviacin. Una curva en forma de "U" o con alguna curvatura, como en el caso de la
edad en la Figura 4b, significa que la distribucin es asimtrica con respecto a la gaussiana, mientras que un
grfico en forma de "S" significar que la distribucin tiene colas mayores o menores que la normal, esto es,
que existen pocas o demasiadas observaciones en las colas de la distribucin.
Parece lgico que cada uno de estos mtodos se complemente con procedimientos de anlisis que
cuantifiquen de un modo ms exacto las desviaciones de la distribucin normal. Existen distintos tests
estadsticos que podemos utilizar para este propsito. El test de Kolmogorov-Smirnov es el ms extendido en
la prctica. Se basa en la idea de comparar la funcin de distribucin acumulada de los datos observados con
la de una distribucin normal, midiendo la mxima distancia entre ambas curvas. Como en cualquier test de
hiptesis, la hiptesis nula se rechaza cuando el valor del estadstico supera un cierto valor crtico que se
obtiene de una tabla de probabilidad. Dado que en la mayora de los paquetes estadsticos, como el SPSS,
aparece programado dicho procedimiento, y proporciona tanto el valor del test como el p-valor
correspondiente, no nos detendremos ms en explicar su clculo. Existen modificaciones de este test, como el
de Anderson-Darling que tambin pueden ser utilizados. Otro procedimiento muy extendido es tambin el
test chi-cuadrado de bondad de ajuste. No obstante, este tipo de procedimientos deben ser utilizados con
precaucin. Cuando se dispone de un nmero suficiente de datos, cualquier test ser capaz de detectar
diferencias pequeas an cuando estas no sean relevantes para la mayor parte de los propsitos. El test de
Kolmogorov-Smirnov, en este sentido, otorga un peso menor a las observaciones extremas y por la tanto es
menos sensible a las desviaciones que normalmente se producen en estos tramos.
Para acabar, observemos el resultado de aplicar el test de Kolmogorov-Smirnov a los datos de la Figura 4. Para
el caso del peso, el valor del estadstico proporcionado por dicho test fue de 0.705, con un p-valor
correspondiente de p=0.702 que, al no ser significativo, indica que podemos asumir una distribucin
normal. Por otra parte, para el caso de la edad, en el que la distribucin muestral era mucho ms asimtrica,
el mismo test proporcion un valor de 1.498, con p=0.022, lo que obligara a rechazar en este caso la hiptesis
de una distribucin gaussiana.

Recursos relacionados en Internet

Normal Density Plotter (UCLA Department of Statistic)
Pgina que permite obtener la representacin grfica de la densidad de una distribucin normal de
media y desviacin estndar dados por el usuario.
SurfStat Statistical Tables - Standard Normal Distribution (University of Newcastle)
Pgina que permite calcular, a partir de una distribucin normal estndar, la probabilidad
acumulada hasta un cierto valor, o la probabilidad de tomar un valor en un intervalo. As mismo,
permite realizar los clculos inversos, es decir, obtener el p-cuantil de una distribucin normal
estndar.
Normal Density Calculator (UCLA Department of Statistic)
Permite obtener, bajo una distribucin normal, la probabilidad de observar un valor mayor o igual
que uno dado. La ventaja es que permite hacerlo no slo para la distribucin normal estndar, sino
para valores de la media y desviacin estndar dados por el usuario.
Matt's spiffy normal plot maker (UCLA Department of Statistic)
Se introducen los datos de la variable de interes y produce el grfico Q-Q de probabilidad normal
correspondiente, que puede ser fcilmente exportado a otros programas.
Calculation of 95% Confidence Interval on a Sample Mean (Arizona State University)
A partir del valor de la media y la desviacin estndar muestral, calcula el 95% intervalo de
confianza para la media poblacional.

Figura 1. Histograma de los valores de tensin arterial sistlica para dos
muestras de pacientes isqumicos ingresados en una unidad de cuidados
intensivos.
Figura 1a.- Valores de tensin arterial sistlica en una muestra de 1000 pacientes
isqumicos ingresados en UCI.

Figura 1b.- Valores de tensin arterial sistlica de una muestra de 5000
pacientes ingresados en UCI.


Figura 2. Grfica de una distribucin normal y significado del rea bajo la curva.


Tabla 1. reas bajo la curva normal estndar. Los valores de la tabla que no se
muestran en negrita representan la probabilidad de observar un valor menor o
igual a z. La cifra entera y el primer decimal de z se buscan en la primera
columna, y el segundo decimal en la cabecera de la tabla.





Segunda cifra decimal del valor de z
z 0.00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
0.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
0.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
0.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
0.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
0.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
0.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
2.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
2.2 .9861 .9864 .9868 .9871 .9875 .4878 .9881 .9884 .9887 .9890
2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
3.0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990
3.1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993
3.2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995
3.3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997
3.4 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998

Figura 3. Ejemplos de distribuciones normales con diferentes parmetros.



Figura 4. Histogramas y grficos de probabilidad normal de los valores de peso y
edad en dos muestras de pacientes.
Figura 4a.- Histogramas



Figura 4b.- Grficos Q-Q de probabilidad.





TEOREMA DEL LIMITE CENTRAL
Teorema del lmite central
El teorema del lmite central o teorema central del lmite indica que, en condiciones muy generales, si S
n
es la
suma de n variables aleatorias independientes, entonces lafuncin de distribucin de S
n
se aproxima bien a
una distribucin normal (tambin llamada distribucin gaussiana, curva de Gauss o campana de Gauss). As
pues, el teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e independientes es lo
suficientemente grande.
1

2

ndice
[ocultar]
1 Definicin
o 1.1 Enunciado formal
2 Propiedades
3 Vase tambin
4 Referencias
5 Enlaces externos
Definicin[editar]
Sea la funcin de densidad de la distribucin normal definida como
1


con una media y una varianza
2
. El caso en el que su funcin de densidad sea , a la
distribucin se le conoce como normal estndar.
Se define S
n
como la suma de n variables aleatorias, independientes, idnticamente distribuidas, y con una
media y varianza
2
finitas (
2
0):

de manera que, la media de S
n
es n y la varianza n
2
, dado que son variables aleatorias
independientes. Con tal de hacer ms fcil la comprensin del teorema y su posterior uso, se hace
una estandarizacin de S
n
como

para que la media de la nueva variable sea igual a 0 y la desviacin estndar sea igual a 1. As, las
variables Z
n
convergern en distribucin a la distribucin normal estndar N(0,1), cuando n tienda
a infinito. Como consecuencia, si (z) es la funcin de distribucin de N(0,1), para cada nmero
real z:

donde Pr( ) indica probabilidad y lim se refiere a lmite matemtico.
Enunciado formal[editar]
De manera formal, normalizada y compacta el enunciado del teorema es:
3

Teorema del lmite central: Sea , , ..., un conjunto de variables aleatorias,
independientes e idnticamente distribuidas con media y varianza
2
distinta de cero. Sea

Entonces
.
Es muy comn encontrarlo con la variable estandarizada Z
n
en funcin de la media
muestral ,

puesto que son equivalentes, as como encontrarlo en versiones no normalizadas como
puede ser:
4

5

Teorema (del lmite central): Sea , , ..., un conjunto de variables aleatorias,
independientes e idnticamente distribuidas de una distribucin con media y
varianza
2
0. Entonces, si n es suficientemente grande, la variable aleatoria

tiene aproximadamente una distribucin normal con y .

Nota: es importante remarcar que este teorema no dice nada acerca de la distribucin
de , excepto la existencia de media y varianza.
4



LECCION 38
Teorema Central del Lmite

El Teorema Central del Lmite dice que si tenemos un grupo numeroso de variables independientes y todas
ellas siguen el mismo modelo de distribucin (cualquiera que ste sea), la suma de ellas se distribuye segn
una distribucin normal.
Ejemplo: la variable "tirar una moneda al aire" sigue la distribucin de Bernouilli. Si lanzamos la moneda al aire
50 veces, la suma de estas 50 variables (cada una independiente entre si) se distribuye segn una distribucin
normal.
Este teorema se aplica tanto a suma de variables discretas como de variables continuas.
Los parmetros de la distribucin normal son:
Media: n * (media de la variable individual multiplicada por el nmero de variables independientes)
Varianza: n *
Veamos un ejemplo:
Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale cruz el valor 0. Cada
lanzamiento es una variable independiente que se distribuye segn el modelo de Bernouilli, con media 0,5 y
varianza 0,25.
Calcular la probabilidad de que en estos 100 lanzamientos salgan ms de 60 caras.
La variable suma de estas 100 variables independientes se distribuye, por tanto, segn una distribucin
normal.
Media = 100 * 0,5 = 50
Varianza = 100 * 0,25 = 25
Para ver la probabilidad de que salgan ms de 60 caras calculamos la variable normal tipificada equivalente:

(*) 5 es la raiz cuadrada de 25, o sea la desviacin tpica de esta distribucin
Por lo tanto:
P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228
Es decir, la probabilidad de que al tirar 100 veces la moneda salgan ms de 60 caras es tan slo del 2,28%
TEOREMA LIMITE CENTRAL
El Teorema Central del Lmite dice que si tenemos un grupo numeroso de variables independientes y todas
ellas siguen el mismo modelo de distribucin (cualquiera que ste sea), la suma de ellas se distribuye segn
una distribucin normal.
Ejemplo : la variable "tirar una moneda al aire" sigue la distribucin de Bernouilli. Si lanzamos la moneda al
aire 50 veces, la suma de estas 50 variables (cada una independiente entre si) se distribuye segn una
distribucin normal.
Este teorema se aplica tanto a suma de variables discretas como de variables continuas.
Los parmetros de la distribucin normal son:
Media : n * (media de la variable individual multiplicada por el nmero de variables independientes)
Varianza : n *
Veamos ahora un ejemplo:
Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale cruz el valor 0. Cada
lanzamiento es una variable independiente que se distribuye segn el modelo de Bernouilli, con media 0,5 y
varianza 0,25. Calcular la probabilidad de que en estos 100 lanzamientos salgan ms de 60 caras.
La variable suma de estas 100 variables independientes se distribuye, por tanto, segn una distribucin
normal.
Media = 100 * 0,5 = 50
Varianza = 100 * 0,25 = 25
Para ver la probabilidad de que salgan ms de 60 caras calculamos la variable normal tipificada equivalente:

(*) 5 es la raiz cuadrada de 25, o sea la desviacin tpica de esta distribucin
Por lo tanto:
P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228
Es decir, la probabilidad de que al tirar 100 veces la moneda salgan ms de 60 caras es tan slo del 2,28%.
Ejercicio 1.
La renta media de los habitantes de un pas se distribuye uniformemente entre 4,0 millones ptas. y 10,0
millones ptas. Calcular la probabilidad de que al seleccionar al azar a 100 personas la suma de sus rentas
supere los 725 millones ptas.
Cada renta personal es una variable independiente que se ditribuye segn una funcin uniforme. Por ello, a la
suma de las rentas de 100 personas se le puede aplicar el Teorema Central del Lmite.
La media y varianza de cada variable individual es:
= (4 + 10 ) / 2 = 7
= (10 - 4)^2 / 12 = 3
Por tanto, la suma de las 100 variables se distribuye segn una normal cuya media y varianza son:
Media: n * = 100 * 7 = 700
Varianza : n *
Para calcular la probabilidad de que la suma de las rentas sea superior a 725 millones ptas, comenzamos por
calcular el valor equivalente de la variable normal tipificada:

Luego:
P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749
Es decir, la probabilidad de que la suma de las rentas de 100 personas seleccionadas al azar supere los 725
millones de pesetas es tan slo del 7,49%

Ejercicio 2.
En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada clase es del 10%. A lo largo
del ao tienes 100 clases de esa asignatura. Cul es la probabilidad de tener que salir a la pizarra ms de 15
veces?
Se vuelve a aplicar el Teorema Central del Lmite.
Salir a la pizarra es una variable independiente que sigue el modelo de distribucin de Bernouilli:
"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10
"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9
La media y la varianza de cada variable independientes es:
= 0,10
= 0,10 * 0,90 = 0,09
Por tanto, la suma de las 100 variables se distribuye segn una normal cuya media y varianza son:
Media : n * = 100 * 0,10 = 10
Varianza : n *
Para calcular la probabilidad de salir a la pizarra ms de 15 veces, calculamos el valor equivalente de la
variable normal tipificada:

Luego:
P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475
Es decir, la probabilidad de tener que salir ms de 15 veces a la pizarra a lo largo del curso es tan slo del
4,75%.
.
DISTRIBUCION DE MEDIAS
. DISTRIBUCIN MUESTRAL DE MEDIAS
Cada muestra de tamao n que podemos extraer de una poblacin proporciona una media. Si consideramos
cada una de estas medias como valores de una variable aleatoria podemos estudiar su distribucin que
llamaremos distribucin muestral de medias.
Si tenemos una poblacin normal y extraemos de ella muestras de tamao n, la distribucin
muestral de medias sigue tambin una distribucin normal

Si la poblacin no sigue una distribucin normal pero n>30, aplicando el llamado Teorema central del
lmite la distribucin muestral de medias se aproxima tambin a la normal anterior.
1) Las notas de cierto examen se distribuyen segn una normal de media 5,8 y desviacin tpica 2,4. Hallar la
probabilidad de que la media de una muestra tomada al azar de 16 estudiantes est comprendida entre 5 y 7

La poblacin es N(5,8;2,4), con
n=16 la distribucin muestral de
medias se distribuye N(5,8;0,6)
En la escena llamamos s a la desviacin
tpica de la poblacin. Compara los
grficos de la distribucin muestral y de
ladistribucin de la poblacin. Estas
distribuciones estn dibujadas con una
escala diferente a la N(0,1), puedes
cambiarla con el valor ESCALA.
Si x es la media de la muestra
hemos de calcular la probabilidad
=P(-
-[1- 0,8854
Pulsando sobre el icono se abrir
una pgina con la tabla N(0,1).
Busca en ella las probabilidades que
corresponden a los valores z
a
y z
b


2) Las estaturas de cierta poblacin se distribuyen N(168,8).
Calcula la probabilidad de que en una muestra de 36 personas la
altura media no difiera de la de la poblacin en ms de 1 cm.
Cambia los valores en la escena, con las
flechas o escribindolos sobre los
actuales y pulsando INTRO. Cambia el
valor de la ESCALA para verlo mejor.


2. DISTRIBUCIN MUESTRAL DE PROPORCIONES
En numerosas ocasiones se plantea estimar una proporcin o porcentaje. En estos casos la variable aleatoria toma
solamente dos valores diferentes (xito o fracaso), es decir sigue una distribucin binomial y cuando la extensin de
la poblacin es grande la distribucin binomial B(n,p) se aproxima a la normal .
Para muestras de tamao n>30, la distribucin muestral de proporciones sigue una distribucin normal

donde p es la proporcin de uno de los valores que presenta la variable estadstica en la poblacin yq=1-p.
3) Si tiramos una moneda no trucada 100 veces, cul es la probabilidad de que obtengamos ms de 55 caras?

En una moneda no trucada la
proporcin de caras es 0,5, con lo
que p=0,5 q=0,5 n=100
La distribucin muestral de
proporciones se distribuye
N(0,5;0,05)
Si llamamos p' a la proporcin en la
muestra hemos de calcular la
probabilidad
P(p'>0,55) = P(z>1) =
=1- -0,8413 = 0,1587
Utiliza la tabla N(0,1) para
comprobar la probabilidad
correspondiente al valor z

4) Una mquina fabrica piezas de precisin y en su produccin
habitual tiene un 3% de piezas defectuosas. Se empaquetan en cajas
de 200, cul es la probabilidad de encontrar entre 5 y 7 piezas
defectuosas en una caja?
Como antes, cambia los valores en la
escena. Cambia tambin el valor de la
ESCALA para verlo mejor.



Distribucin muestral de medias
), se sabe (Teorema del lmite central) que la fdp de
la media muestral es tambin normal con media y varianza
2
/n. Esto es exacto para poblaciones normales y
aproximado (buena aproximacin con n>30) para poblaciones cualesquiera. Es decir es el error tpico, o
error estndar de la media.
Cmo usamos esto en nuestro problema de estimacin?
1 problema: No hay tablas para cualquier z); pero haciendo
la transformacin (llamadatipificacin)

una normal de media y desviacin se transforma en una z.

Llamando z al valor de una variable normal
tipificada que deja a su derecha un rea bajo la curva
mayor que ese valor es
ofrece la tabla de la normal)
podremos construir intervalos de la forma

para los que la probabilidad es 1 -

Teniendo en cuenta la simetra de la normal y manipulando algebracamente

que tambin se puede escribir

o, haciendo nfasis en que es el error estndar de la media,

Recurdese que la probabilidad de que est en este intervalo es 1 - intervalo de este tipo se le
denomina intervalo de confianza con unnivel de confianza del 100(1 - nivel de significacin
nivel de confianza habitual es el 95%, en cuyo caso z
/2
=1,96. Al valor se le denomina estimacin
puntual y se dice que es un estimador de
Ejemplo: Si de una poblacin normal con varianza 4 se extrae una muestra aleatoria de tamao 20 en la que se
calcula se puede decir que

que sera el intervalo de confianza al 95% para
En general esto es poco til, en los casos en que no se conoce tampoco suele conocerse
2
; en el caso ms
realista de
2
desconocida los intervalos de confianza se construyen con la t de Student (otra fdpcontinua para
la que hay tablas) en lugar de la z.

o, haciendo nfasis en que es el error estndar estimado de la media,

Este manera de construir los intervalos de confianza slo es vlido si la variable es normal. Cuando n es grande
(>30) se puede sustituir t por zsin mucho error.
Otras lecturas recomendadas
Interpreting study results: confidence intervals. Guyatt et al. CMAJ.152:169-173. 1995
3.- Clculo del tamao de la muestra
A la hora de determinar el tamao que debe alcanzar una muestra hay que tomar en cuenta varios factores: el
tipo de muestreo, el parmetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de
confianza. Por ello antes de presentar algunos casos sencillos de clculo del tamao muestral delimitemos
estos factores.
Parmetro. Son las medidas o datos que se obtienen sobre la poblacin.
Estadstico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacin de los
parmetros.
Error Muestral, de estimacin o standard. Es la diferencia entre un estadstico y su parmetro
correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor
de la poblacin, nos da una nocin clara de hasta dnde y con qu probabilidad una estimacin basada en una
muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un
error, pero la naturaleza de la investigacin nos indicar hasta qu medida podemos cometerlo (los resultados
se someten a error muestral e intervalos de confianza que varan muestra a muestra). Vara segn se calcule al
principio o al final. Un estadstico ser ms preciso en cuanto y tanto su error es ms pequeo. Podramos
decir que es la desviacin de la distribucin muestral
(1)
de un estadstico y su fiabilidad.
Nivel de Confianza. Probabilidad de que la estimacin efectuada se ajuste a la realidad. Cualquier informacin
que queremos recoger est distribuida segn una ley de probabilidad (Gauss o Student), as llamamos nivel de
confianza a la probabilidad de que el intervalo construido en torno a un estadstico capte el verdadero valor
del parmetro.
Varianza Poblacional. Cuando una poblacin es ms homognea la varianza es menor y el nmero de
entrevistas necesarias para construir un modelo reducido del universo, o de la poblacin, ser ms pequeo.
Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.
3.1.- Tamao de muestra para estimar la media de la poblacin
Veamos los pasos necesarios para determinar el tamao de una muestra empleando el muestreo aleatorio
simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos
trabajar; en segundo lugar, cual es el error mximo que estamos dispuestos a admitir en nuestra estimacin.
As pues los pasos a seguir son:
1.- Obtener el tamao muestral imaginando que :

donde:
: z correspondiente al nivel de confianza elegido
: varianza poblacional
e: error mximo
2.- Comprobar si se cumple

si esta condicin se cumple el proceso termina aqu, y ese es el tamao adecuado que debemos muestrear.
Si no se cumple, pasamos a una tercera fase:
3.- Obtener el tamao de la muestra segn la siguiente frmula:

Veamos un ejemplo: La Consejera de Trabajo planea un estudio con el inters de conocer el promedio de
horas semanales trabajadas por las mujeres del servicio domstico. La muestra ser extrada de una poblacin
de 10000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a travs de un
estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos
a admitir un error mximo de 0,1, cul debe ser el tamao muestral que empleemos?.
Buscamos en las tablas de la curva normal el valor de que corresponde con el nivel de confianza
elegido: = 1.96 y seguimos los pasos propuestos arriba.
1.-

2.- Comprobamos que no se cumple , pues en este caso
10000 < 3706 (3706 - 1); 10000 < 13730730
3.-

3.2.- Tamao de muestra para estimar la proporcin de la poblacin
Para calcular el tamao de muestra para la estimacin de proporciones poblacionales hemos de tener en
cuenta los mismos factores que en el caso de la media. La frmula que nos permitir determinar el tamao
muestral es la siguiente:

donde
: z correspondiente al nivel de confianza elegido
P: proporcin de una categora de la variable
e: error mximo
N: tamao de la poblacin
Siguiendo con el estudio planteado en el punto anterior, supongamos que tratamos de estimar la proporcin
de mujeres que trabajan diariamente 10 horas o ms. De un estudio piloto se dedujo que P=0.30, fijamos el
nivel de confianza en 0.95 y el error mximo 0.02.



(1) Por distribucin muestral se entiende la distribucin de frecuencias de los valores de un estadstico en
infinitas muestras iguales.
Estimacin de una Proporcin
Un estimador puntual de la proporcin P en un experimento binomial est dado por la estadstica P=X/N,
donde x representa el nmero de xitos en n pruebas. Por tanto, la proporcin de la muestra p =x/n se
utiulizar como estimador puntual del parmetro P.
Si no se espera que la proporcin P desconocida est demasiado cerca de 0 de 1, se puede establecer un
intervalo de confianza para P al considerar la distribucin muestral de proporciones.

Al despejar P de esta ecuacin nos queda:

En este despeje podemos observar que se necesita el valor del parmetro P y es precisamente lo que
queremos estimar, por lo que lo sustituiremos por la proporcin de la muestra p siempre y cuando el tamao
de muestra no sea pequeo.

Cuando n es pequea y la proporcin desconocida P se considera cercana a 0 a 1, el procedimiento del
intervalo de confianza que se establece aqu no es confiable, por tanto, no se debe utilizar. Para estar seguro,
se debe requerir que np nq sea mayor o igual a 5.
El error de estimacin ser la diferencia absoluta entre p y P, y podemos tener el nivel de confianza de que
esta diferencia no exceder .
Ejemplos:
1. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para
evaluar la funcin elctrica de su producto. Todos los reproductores de discos compactos deben pasar
todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como
resultado 15 que fallan en una o ms pruebas. Encuentre un intervalo de confianza de 90% para la
proporcin de los reproductores de discos compactos de la poblacin que no pasan todas las pruebas.
Solucin:
n=500
p = 15/500 = 0.03
z(0.90) = 1.645

0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporcin de discos defectuosos que no pasan la
prueba en esa poblacin esta entre 0.0237 y 0.0376.
2. En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se encontraron 20 defectuosas.
Si la proporcin p de pilas defectuosas en esa muestra se usa para estimar P, que vendr a ser la
proporcin verdadera de todas las pilas defectuosas tipo B fabricadas por la Everlast Company,
encuentre el mximo error de estimacin tal que se pueda tener un 95% de confianza en que P dista
menos de de p.

Solucin:
p=x/n = 20/400=0.05
z(0.95)=1.96

Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza en que P dista menos de 0.021
de p. En otras palabras, si p=0.05 se usa para erstimar P, el error mximo de estimacin ser
aproximadamente 0.021 con un nivel de confianza del 95%.
Para calcular el intervalo de confianza se tendra:

Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del 95% se sabe que la
proporcin de pulas defectuosas de esta compaa est entre 0.029 y 0.071.
Si se requiere un menor error con un mismo nivel de confianza slo se necesita aumentar el tamao
de la muestra.
3. En un estudio de 300 accidentes de automvil en una ciudad especfica, 60 tuvieron consecuencias
fatales. Con base en esta muestra, construya un intervalo del 90% de confianza para aproximar la
proporcin de todos los accidentes automovilsticos que en esa ciudad tienen consecuencias fatales.
Solucin:
P= 60/300 = 0.20
Z(0.90) = 1.645

0.162<P<0.238
Estimacin de la Diferencia entre dos Medias
Si se tienen dos poblaciones con medias
1
y
2
y varianzas
1
2
y
2
2
, respectivamente, un estimador
puntual de la diferencia entre
1
y
2
est dado por la estadstica . Por tanto. Para obtener una
estimacin puntual de
1
-
2,
se seleccionan dos muestras aleatorias independientes, una de cada poblacin, de tamao n
1
y n
2
, se
calcula la diferencia , de las medias muestrales.
Recordando a la distribucin muestral de diferencia de medias:

Al despejar de esta ecuacin
1
-
2
se tiene:

En el caso en que se desconozcan las varianzas de la poblacin y los tamaos de muestra sean mayores a 30 se
podr utilizar la varianza de la muestra como una estimacin puntual.
Ejemplos:
1. Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B. Se mide el
rendimiento en millas por galn de gasolina. Se realizan 50 experimentos con el motor tipo A y 75 con
el motor tipo B. La gasolina que se utiliza y las dems condiciones se mantienen constantes. El
rendimiento promedio de gasolina para el motor A es de 36 millas por galn y el promedio para el
motor B es 24 millas por galn. Encuentre un intervalo de confianza de 96% sobre la diferencia
promedio real para los motores A y B. Suponga que las desviaciones estndar poblacionales son 6 y 8
para los motores A y B respectivamente.
Solucin:
Es deseable que la diferencia de medias sea positiva por lo que se recomienda restar la media mayor
menos la media menor. En este caso ser la media del motor B menos la media del motor A.
El valor de z para un nivel de confianza del 96% es de 2.05.

3.43<
B
-
A
<8.57
La interpretacin de este ejemplo sera que con un nivel de confianza del 96% la diferencia del
rendimiento promedio esta entre 3.43 y 8.57 millas por galn a favor del motor B. Esto quiere decir
que el motor B da mas rendimiento promedio que el motor A, ya que los dos valores del intervalo son
positivos.
2. Una compaa de taxis trata de decidir si comprar neumticos de la marca A o de la B para su flotilla de
taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento utilizando 12 de
cada marca. Los neumticos se utilizan hasta que se desgastan, dando como resultado promedio para
la marca A 36,300 kilmetros y para la marca B 38,100 kilmetros. Calcule un intervalo de confianza de
95% para la diferencia promedio de las dos marcas, si se sabe que las poblaciones se distribuyen de
forma aproximadamente normal con desviacin estndar de 5000 kilmetros para la marca A y 6100
kilmetros para la marca B.
Solucin:

-2662.68<
B
-
A
<6262.67
Grficamente:

Como el intervalo contiene el valor "cero", no hay razn para creer que el promedio de duracin del
neumtico de la marca B es mayor al de la marca A, pues el cero nos est indicando que pueden tener la
misma duracin promedio.
Estimacin de la Diferencia de dos Proporciones
En la seccin anterior se vio el tema de la generacin de las distribuciones muestrales, en donde se tena el
valor de los parmetros, se seleccionaban dos muestras y podamos calcular la probabilidad del
comportamiento de los estadsticos. Para este caso en particular se utilizar la distribucin muestral de
diferencia de proporciones para la estimacin de las misma. Recordando la formula:

Despejando P
1
-P
2
de esta ecuacin:

Aqu se tiene el mismo caso que en la estimacin de una proporcin, ya que al hacer el despeje nos queda las
dos proporciones poblacionales y es precisamente lo que queremos estimar, por lo que se utilizarn las
proporciones de la muestra como estimadores puntuales:

Ejemplos:
1. Se considera cierto cambio en un proceso de fabricacin de partes componentes. Se toman muestras
del procedimiento existente y del nuevo para determinar si ste tiene como resultado una mejora. Si
se encuentra que 75 de 1500 artculos del procedimiento actual son defectuosos y 80 de 2000 artculos
del procedimiento nuevo tambin lo son, encuentre un intervalo de confianza de 90% para la
diferencia real en la fraccin de defectuosos entre el proceso actual y el nuevo.
Solucin:
Sean P
1
y P
2
las proporciones reales de defectuosos para los procesos actual y nuevo, respectivamente.
De aqu, p
1
=75/1500 = 0.05 y p
2
= 80/2000 = 0.04. con el uso de la tabla encontramos que z para un
nivel de confianza del 90% es de 1.645.

-0.0017<P
1
-P
2
<0.0217
Como el intervalo contiene el valor de cero, no hay razn para creer que el nuevo procedimiento
producir una disminucin significativa en la proporcin de artculos defectuosos comparado con el
mtodo existente.
2. Un artculo relacionado con la salud, reporta los siguientes datos sobre la incidencia de disfunciones
importantes entre recin nacidos con madres fumadoras de marihuana y de madres que no la
fumaban:
Usuaria No Usuaria
Tamao Muestral 1246 11178
Nmero de disfunciones 42 294
Proporcin muestral 0.0337 0.0263
Encuentre el intervalo de confianza del 99% para la diferencia de proporciones.
Solucin:
Representemos P
1
la proporcin de nacimientos donde aparecen disfunciones entre todas las madres que
fuman marihuana y definamos P
2
, de manera similar, para las no fumadoras. El valor de z para un 99% de
confianza es de 2.58.

-0.0064<P
1
-P
2
<0.0212
Este intervalo es bastante angosto, lo cual sugiere que P
1
-P
2
ha sido estimado de manera precisa.
Determinacin de Tamaos de Muestra para Estimaciones
Al iniciar cualquier investigacin, la primer pregunta que surge es: de qu tamao debe ser la o las
muestras?. La respuesta a esta pregunta la veremos en esta seccin, con conceptos que ya se han visto a
travs de este material.

Clculo del Tamao de la Muestra para Estimar una Media
Qu tan grande debe ser una muestra si la media muestral se va a usar para estimar la media poblacional?.
La respuesta depende del error estndar de la media, si este fuera cero, entonces se necesitara una sola
media que ser igual necesariamente a la media poblacional desconocida , porque = 0. Este caso
extremo no se encuentra en la prctica, pero refuerza el hecho de que mientras menor sea el error estndar
de la media, menor es el tamao de muestra necesario para lograr un cierto grado de precisin.
Se estableci antes que una forma de disminuir el error de estimacin es aumentar el tamao de la muestra, si
ste incluye el total de la poblacin, entonces sera igual a cero. Con esto en mente, parece razonable
que para un nivel de confianza fijo, sea posible determinar un tamao de la muestra tal que el error de
estimacin sea tan pequeo como queramos, para ser mas preciso, dado un nivel de confianza y un error fijo
de estimacin , se puede escoger un tamao de muestra n tal que P( ) = Nivel de confianza. Con
el propsito de determinar n. El error mximo de estimacin esta dado por:

Si se eleva al cuadrado ambos lados de esta ecuacin y se despeja n de la ecuacin resultante, obtenemos:

Como n debe de ser un nmero entero, redondeamos hacia arriba todos los resultados fraccionarios.
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de estimacin se
convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

Ejemplos:
1. Un bilogo quiere estimar el peso promedio de los ciervos cazados en el estado de Maryland. Un
estudio anterior de diez ciervos cazados mostr que la desviacin estndar de sus pesos es de 12.2
libras. Qu tan grande debe ser una muestra para que el bilogo tenga el 95% de confianza de que el
error de estimacin es a lo ms de 4 libras?
Solucin:

En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza en
que difiere en menos de 4 libras de .
2. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normal con una
desviacin estndar de 40 horas. De qu tamao se necesita una muestra si se desea tener 96% de
confianza que la media real est dentro de 10 horas de la media real?

Se necesita una muestra de 68 focos para estimar la media de la poblacin y tener un error mximo de
10 horas.
Qu pasara si en lugar de tener un error de estimacin de 10 horas slo se requiere un error de 5
horas?

Se puede observar como el tamao de la muestra aumenta, pero esto tiene como beneficio una
estimacin ms exacta.
3. Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y se desea saber de que
tamao debe de ser la muestra. El muestreo se realizar sin reemplazo.
Solucin:
Como se tiene una poblacin finita y un muestreo sin reemplazo es necesario utilizar la formula con el factor
de correccin.

Si se tiene una poblacin finita de 300 focos slo se tiene que extraer de la poblacin una muestra sin
reemplazo de 56 focos para poder estimar la duracin media de los focos restantes con un error mximo de 10
horas.
Clculo del Tamao de la Muestra para Estimar una Proporcin
Se desea saber que tan grande se requiere que sea una muestra para asegurar que el error al estimar P sea
menor que una cantidad especfica .

Elevando al cuadrado la ecuacin anterior se despeja n y nos queda:

Esta frmula est algo engaosa, pues debemos utilizar p para determinar el tamao de la muestra, pero p se
calcula a partir de la muestra. Existen ocasiones en las cuales se tiene una idea del comportamiento de la
proporcin de la poblacin y ese valor se puede sustituir en la frmula, pero si no se sabe nada referente a esa
proporcin entonces se tienen dos opciones:
Tomar una muestra preliminar mayor o igual a 30 para proporcionar una estimacin de P. Despus con
el uso de la frmula se podra determinar de forma aproximada cuntas observaciones se necesitan
para proporcionar el grado de precisin que se desea.
Tomar el valor de p como 0.5 ya que sustituyendo este en la frmula se obtiene el tamao de muestra
mayor posible. Observe el siguiente ejemplo:
Se desconoce el valor de P, por lo que se utilizarn diferentes valores y se sustituirn en la formula para
observar los diferentes tamaos de muestras. El nivel de confianza que se utilizar es del 95% con un error de
estimacin de 0.30.
p

n
0.10

3.84
0.20

6.82
0.30

8.96
0.40

10.24
0.50

10.67
0.60

10.24
0.70

8.96
0.80

6.82
0.90

3.84
Como se puede observar en la tabla anterior cuando P vale 0.5 el tamao de la muestra alcanza su mximo
valor.
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de estimacin se
convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:


Ejemplos:
1. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton, Canad, se
encuentra que 340 estn suscritas a HBO. Qu tan grande se requiere que sea una muestra si se
quiere tener 95% de confianza de que la estimacin de P est dentro de 0.02?
Solucin:
Se tratarn a las 500 familias como una muestra preliminar que proporciona una estimacin de
p=340/500=0.68.

Por lo tanto si basamos nuestra estimacin de P sobre una muestra aleatoria de tamao 2090, se
puede tener una confianza de 95% de que nuestra proporcin muestral no diferir de la proporcin
real por ms de 0.02.
2. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qu proporcin del
electorado conoce la opinin de ella, respecto al uso de fondos estatales para pagar abortos. Qu
tamao de muestra se necesita si se requiere un confianza del 95% y un error mximo de estimacin
de 0.10?
Solucin:
En este problema, se desconoce totalmente la proporcin de residentes que conoce la opinin de la
legisladora, por lo que se utilizar un valor de 0.5 para p.

Se requiere un tamao de muestra de 97 residentes para que con una confianza del 95% la estimacin tenga
un error mximo de 0.10.
Clculo del Tamao de la Muestra para Estimar la Diferencia de Medias
Si se recuerda a la distribucin muestral de diferencia de medias se tiene que error esta dado por:

En esta ecuacin se nos pueden presentar dos casos:
Los tamaos de muestra son iguales.
Los tamao de muestra son diferentes .
Para el primer caso no se tiene ningn problema, se eleva al cuadrado la ecuacin y se despeja n ya que n
1
es
igual a n
2.


Para el segundo caso se pondr una n en funcin de la otra. Este caso se utiliza cuando las poblaciones son de
diferente tamao y se sabe que una es K veces mayor que la otra.


Ejemplo:
Un director de personal quiere comparar la efectividad de dos mtodos de entrenamiento para trabajadores
industriales a fin de efectuar cierta operacin de montaje. Se divide un nmero de operarios en dos grupos
iguales: el primero recibe el mtodo de entrenamiento 1, y el segundo, el mtodo 2. Cada uno realizar la
operacin de montaje y se registrar el tiempo de trabajo. Se espera que las mediciones para ambos grupos
tengan una desviacin estndar aproximadamente de 2 minutos. Si se desea que la estimacin de la diferencia
en tiempo medio de montaje sea correcta hasta por un minuto, con una probabilidad igual a 0.95, cuntos
trabajadores se tienen que incluir en cada grupo de entrenamiento?

Cada grupo debe contener aproximadamente 31 empleados.
Clculo del Tamao de la Muestra para Estimar la Diferencia de Proporciones
Si se recuerda a la distribucin muestral de diferencia de medias se tiene que error esta dado por:

En esta ecuacin se nos pueden presentar dos casos:
Los tamaos de muestra son iguales.
Los tamao de muestra son diferentes .
Para el primer caso no se tiene ningn problema, se eleva al cuadrado la ecuacin y se despeja n ya que n
1
es
igual a n
2.


Para el segundo caso se pondr una n en funcin de la otra. Este caso se utiliza cuando las poblaciones son de
diferente tamao y se sabe que una es K veces mayor que la otra.


Ejemplo:
Una compaa de productos alimenticios contrat a una empresa de investigacin de mercadotecnia , para
muestrear dos mercados, I y II, a fin de comparar las proporciones de consumidores que prefieren la comida
congelada de la compaa con los productos de sus competidores. No hay informacin previa acerca de la
magnitud de las proporciones P
1
y P
2
. Si la empresa de productos alimenticios quiere estimar la diferencia
dentro de 0.04, con una probabilidad de 0.95, cuntos consumidores habr que muestrear en cada
mercado?

Se tendr que realizar encuestas a 1201 consumidores de cada mercado para tener una estimacin con una
confianza del 95% y un error mximo de 0.04.
TEORIA DE LA ESTIMACION ESTADSTICA
Estimacin de Parmetros
La teora de muestreo puede emplearse para obtener informacin acerca de muestras obtenidas
aleatoriamente de una poblacin conocida. Sin embargo, desde un punto de vista practico, suele ser mas
importante y ser capaz de inferir informacin acerca de una poblacin a partir de muestras de ellas. Dichos
problemas son tratados por lainferencia estadstica que utiliza principios de muestreo. Un problema
importante de la inferencia estadstica es la estimacin de parmetros poblacionales o
simplementeparmetros ( como la media y la varianza poblacionales ), a partir de
los estadsticosmustrales correspondientes o estadsticos ( como la media y la varianza muestral.
Estimados sin Sesgo
Si la media de la distribucin muestral de un estadstico es igual al parmetro poblacional correspondiente,
el estadstico se denomina estimador sin sesgo del parmetro; de otra manera, es denominado estimador
sesgado. Los valores correspondientes de dichos estadsticos se llaman estimados sin sesgo o sesgados,
respectivamente.
1.- La media de la distribucin muestral de las medias es x , la media poblacional. Por lo tanto, la media
muestral x es un estimado sin sesgo de la media poblacional .
2.- La media de la distribucin muestral de las varianzas es :
s2 = ( N-1/ N ) 2
donde 2 es la varianza poblacional y N es el tamao de la muestra .Entonces, la varianza muestral s2 es un
estimado sesgado de la varianza poblacional 2. Usando la varianza modificada.
2 =( N/ N-1 )s2
Se encuentra que 2 = 2 , de modo que 2 es un estimado sin sesgo de 2 .Sin embargo es un estimado de .En
trminos de esperanza matemtica se poda decir que unestadstico no esta sesgado si su esperanza es igual
al parmetro poblacional correspondiente. Por lo tanto, x y 2 no estn sesgados , porque E
Estimados Eficientes
Si las distribuciones mustrales de dos estadsticos tienen la misma media o esperanza matemtica entonces
el estadstico con la menor varianza se denomina estimadoreficiente de la media , mientras que el
otro estadstico se le llama estimador ineficiente. Los valores correspondientes de los estadsticos se
conocen, respectivamente , comoestimadores eficientes. Si se consideran todos los estadsticos posibles,
cuyas distribuciones mustrales tienen la misma media, aquel con la menor varianza suele denominarse el
mejor o mas eficiente estimador de dicha media.
La distribucin muestral de la media y la mediana tienen la misma media; a saber la media poblacional. Sin
embargo, la varianza de la distribucin muestral de las medias es mas pequea que la varianza de la
distribucin muestral de las medianas . por lo tanto, la media muestral ofrece un estimado ineficiente de
esta De todos losestadsticos que estiman la media poblacional, la media muestral ofrece el mejor o mas
eficiente estimado. En la practica , suelen usarse los estimados ineficientes debido a la relativa facilidad con
que se obtienen algunos de ellos.
Estimados por Punto y Estimados por Intervalo; su Confiabilidad
El estimado de un parmetro poblacional dado por un solo numero se denominaestimado puntual del
parmetro. El estimado de un parmetro poblacional dado por dos nmeros , entre los cuales se considera
esta el parmetro, se denomina estimado por intervalo del parmetro. Los estimados por intervalo indican
la precisin de un estimado y son, por lo tanto preferibles a los estimados por punto.
Ejemplo: Si se dice que una distancia medida es de 5.28 metros se esta dando un estimado por punto. Si por
otro lado, la distancia es de 5.28 mas menos 0.03metros ( es decir , la distancia esta entre 5.25m y 5.31 m ) ,
se esta dando un estimado por intervalo .
La informacin sobre el error o precisin de un estimado se conoce como confiabilidad.
Estimados por Intervalo de Confianza de Parmetros Poblacionales
Sean s y s la media y la desviacin estndar ( error estndar ), en ese orden, de la distribucin muestral de
un estadstico S. Entonces, si la distribucin muestral de S es en formas aproximadas a la normal ( lo cual es
verdadero para muchos estadsticos si el tamao de la muestra es N mayor o menor que 30.
Intervalos de Confianza para Medias
Si el estadstico S es la media muestral x , entonces los limites de confianza de 95% y 99% para estimar la
media poblacional estn dados por x mas menos 1.96 x y 2.50x respectivamente. De manera mas general ,
los limites de confianza estn dados por x zc xdonde zc que depende del nivel particular de confianza
deseado , usando los valores de x obtenidos se ve que los limites de confianza para la media poblacional
estn dados por :
X Zc /
si el muestreo se lleva a cabo a partir de una poblacin infinita o de una poblacin finita con
reemplazamiento y estn dados por :
X Zc /
si el muestreo se realizo sin reempalzamiento de una poblacin de tamao finito Np . generalmente , la
desviacin estndar poblacional es desconocida ; por consiguiente , para obtener los limites de confianza
anteriores, se utiliza la estimacin muestral o s .Esta mostrara ser satisfactoria cuando N se mayor o menor
que 30 para N menor que 30 , la aproximacin es pobre y se debe usar la teora de pequeas muestras .
Intervalos de Confianza para Proporciones
Si el estadstico S es la proporcin de xitos en una muestra de tamao , obtenida de una poblacin
binomial en la que p es la proporcin de xitos es decir la probabilidad de xito, entonces los limites de
confianza para p estn dados por la proporcin de xitos en la muestra de tamao N. Usando los valores
de p obtenidos, ve que los limites de confianza para la proporcin poblacional estn dados por :
P Zc
Si el muestreo se efectu de una poblacin finita o de una poblacin infinita con reemplazamiento y estn
dados por :
P Zc
Si el muestreo se hizo sin el reemplazamiento de una poblacin de tamao finito Np. Para calcular estos
limites de confianza se puede usar el estimado muestral P que por lo general , mostrara ser satisfactorio si N
es mayor o igual a 30.
Intervalos de Confianza para Diferencias y Sumas
Si S1 y S2 son dos estadsticos mustrales con distribuciones de muestreo aproximadamente normales,
entonces los limites de confianza se puede usar para la diferencia de los parmetros poblacionales
correspondientes a S1 y S2 estn dados por :
S1 y S2 zc s1 - s2
Intervalos de Confianza para Desviaciones Estndar
Los limites de confianza para la desviacin estndar de una poblacin normalmente distribuida, estimados
a partir de una muestra con desviacin estndar s, estn dados por :
S + - Zc s = s Zc /
Para calcular estos limites de confianza se utiliza s o para estimar
Error Probable
Los limites de confianza de 50% de los parmetros poblacionales correspondientes al estadstico S dados por
S + - 0.675 s la cantidad de 0.675 s es conocida como error probable de la estimacin.
Problemas Resueltos
Estimados sin Sesgo y eficientes
1.- De un ejemplo de estimadores y estimados que sean a).- sin sesgo y eficientes , b).- sin sesgo e
ineficientes y c).- sesgados e ineficientes
Solucin
a).- La media maestral x y la varianza maestral modificada
2 =( N/ N-1 ) s2
b).- La media muestral y el estadstico muestral (Q1 + Q3) donde Q1 y Q3 son los cuartiles inferior y
superior , son dos de dichos ejemplos. Ambos estadsticos son estimados sin sesgo de la media poblacional,
ya que la media de sus distribuciones mustrales es la media poblacional.
c).- La desviacin estndar muestral s , la desviacin estndar modificada , la desviacin media y el rango
semiintercuartilar son cuatro de dichos ejemplos
2.- En una muestra de cinco mediciones , los registros de un cientfico para el dimetro de una esfera fueron
6.33, 6.37, 6.32, 6.37 centmetros. Determine estimados sin sesgo y eficientes de a) la media verdadera y b)
la varianza verdadera.
Solucin
a).- el estimado sin sesgo y eficiente de la media verdadera , es decir , la media poblacional es :
x = x / N = 6.33 + 6.37 + 6.36 +6.32 + 6.37 / 5 = 6.35 cm
b).- El estimado sin sesgo y eficiente de la varianza verdadera , es decir la varianza poblacional es :
2 = ( N / N - 1 ) s2
(6.33 - 6.35 )2 + ( 6.37 - 6.35 ) 2 + ( 6.32 - 6.35 ) 2 + ( 6.37 - 6.35 )2 / 5 - 1 = 5.5 x 10 - 4 cm2
3.- Suponga que las estaturas de 100 estudiantes hombres de la universidad XYZ representan una muestral
aleatoria de las estaturas del total de 1546 estudiantes de la universidad. Determine los estimados sin sesgo
y eficientes de a) la media verdadera y b) la varianza verdadera.
Solucin
a) Del problema , el estimado sin sesgo y eficiente de la estatura media verdadera es x = 67.47 pulgadas
b) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es :
2 = ( N/ N-1 ) s2 = (100/99 ) 8.5275 = 8.6136
Por lo tanto = "8.6136 = 2.93 pulgadas. Obsrvese que dado que N es grande esencialmente no existe
diferencia entre y 2 .
4.- De un estimado sin sesgo e ineficiente del dimetro medio verdadero de la esfera del problema 2.
Solucin
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media poblacional. Para las cinco
mediciones, ordenadas por magnitud, la media es 6.36 cm
5.- En una muestra de cinco mediciones , los registros de un cientfico para el dimetro de una esfera fueron
6.33, 6.37, 6.33, 6.38 centmetros. Determine estimados sin sesgo y eficientes de a) la media verdadera
Solucin
a).- el estimado sin sesgo y eficiente de la media verdadera , es decir , la media poblacional es :
x = x / N = 6.33 + 6.37 + 6.36 +6.33 + 6.38 / 5 = 6.354 cm
6.- Suponga que las estaturas de 10 estudiantes hombres de la universidad XYZ representan una muestral
aleatoria de las estaturas del total de 100 estudiantes de la universidad. Determine los estimados sin sesgo
y eficientes de
Solucin
a) Del problema el estimado sin sesgo y eficiente de la varianza verdadera es :
2 = ( N/ N-1 ) s2 = (10/9 ) 8.5275 = 9.47
7.- De un estimado sin sesgo e ineficiente del dimetro medio verdadero de la esfera del problema 2.
Solucin
La mediana es un ejemplo de un estimado sin sesgo e ineficientes de la media poblacional. Para las cinco
mediciones, ordenadas por magnitud, la media es 6.36 cm
Intervalos de Confianza para Medias
8.- Calcule los intervalos de confianza a) a 95% y b) 99% para estimar la estatura media de los estudiantes
de la universidad veracruzana del problema 3.
Solucin
a) Los limites de confianza a 95% son x 1.96 / ( N )1/2 . Usando x = 67.45 pulg. y = 2.93 pulgadas como un
estimado de , los limites de confianza son 67.45 0.57 pulgadas. Por lo tanto, el intervalo de confianza a
95% para la media poblacional es de 66.88 a 68.02 pulg. Que puede expresarse como 66.08 menor
que menor que 68.21.
Para obtener los intervalos de confianza anteriores, se considero que la poblacin era infinita o tan grande
como para realizar un muestreo con remplazamiento. En el caso de poblaciones finitas, donde el muestreo
se hace sin remplazamiento se debe utilizar :
/
Sin embargo se puede considerar el factor:
= 0.967
Es esencialmente 1 por lo tanto no ser necesario usarlo. Si se utiliza, los limites de confianza anteriores se
convierten en 67.45 0.56 pulgadas y 67.45 0.73 pulgadas respectivamente .
9.- Una empresa de rboles navideos tienen 5000 rboles listos para cortarse. Se seleccionan
aleatoriamente cien de estos rboles y se mide su altura. Las alturas, en pulgadas se muestran en la
siguiente tabla. Utilice minitab para establecer un intervalo de confianza a 95% de la altura media a los
5000 rboles. Si estos se venden a $ 2.40 por pie de un limite superior y uno inferior sobre el valor de los
5000 rboles .
56 61 52 62 63 34 47 35 44 59
70 61 65 51 65 72 55 71 57 75
53 48 55 67 60 60 73 74 43 74
71 53 78 59 56 62 48 65 68 51
73 62 80 53 64 44 67 45 58 48
50 57 72 55 56 62 72 57 49 62
46 61 52 46 72 56 46 48 57 52
54 73 71 70 66 67 58 71 75 50
44 59 56 54 63 43 68 69 55 63
48 49 70 60 67 47 49 69 66 73
Solucin
El intervalo de confianza del minitab presentado a continuacin indica que la altura media de los 5000
rboles puede ser tan pequea como 57.24 o tan grande como 61.20 pulgadas. El numero total de pulgadas
para los 5000 rboles oscila entre (57.24) (5000) = 286200 y (61.20) (5000) = 306000. Si los rboles se venden
a $ 2.40 por pie , entonces el costo por pulgada es de $ 0.2. El valor de los rboles oscila entre ( 286000)(0.2)
= $ 57200 y (306000)(0.2) = $ 61200 con 95% de confianza
10.- Para medir el tiempo de reaccin ,un psiclogo estima que la desviacin estndar de 0.05 segundos
Que tan grande debe ser una muestra de mediciones para tener a) 95 % y b) 99 % de confianza en que el
error de este estimado no exceder de 0.01 segundos ?
Solucin
a) Los limites de confianza a 95 % son de x 1.96 / con el error de estimacin 1.96 / tomando = s = 0.05
segundos se debe ver que el error ser igual a 0.01 segundos si ( 1.96) ( 0.05 )/ = ( 1.96 ) ( 0.05 )/ 0.01 = 9.8 o
N = 96.04
b) Los limites de confianza a 99 % son x 2.58 /
11.- Una muestra aleatoria de 50 calificaciones ,de un total de 200 mostr una media de 75 y una desviacin
de 10
a).- Cuales son los limites de confianza a 95 % para estimados de la media de las 200 calificaciones ?
b).- Con que nivel de confianza se puede decir que la media de las 200 calificaciones es de 75 1?
Solucin
a) Dado que el tamao de la poblacin no es muy grande comparado con el de la muestra , se debe de
ajustar. Entonces , los limites de confianza a 95% son :
x 1.96 x = x 1.96 /
75 1.96 (10/ " 50 )( / 199) = 75 2.4
b) Los limites de confianza pueden representarse as :
x zc x = x zc / =
75 zc (10/)( / 199) = 75 1.23 zc
12.- Una empresa de rboles navideos tienen 5000 rboles listos para cortarse. Se seleccionan
aleatoriamente cien de estos rboles y se mide su altura. Las alturas, en pulgadas se muestran en la
siguiente tabla. Utilice minitab para establecer un intervalo de confianza a 95% de la altura media a los
5000 rboles. Si estos se venden a $ 2.80 por pie de un limite superior y uno inferior sobre el valor de los
5000 rboles .
60 61 52 62 63 34 47 35 44 52
70 61 65 51 65 72 55 71 57 75
53 48 55 67 60 60 73 74 43 74
71 53 78 59 56 62 48 65 68 51
73 62 80 53 64 44 67 45 58 48
50 57 72 55 56 62 72 57 49 62
46 61 52 46 72 56 46 48 57 52
54 73 71 70 66 67 58 71 75 50
44 59 56 54 63 43 68 69 55 63
48 49 70 60 68 47 49 69 66 75
Solucin
El intervalo de confianza del minitab presentado a continuacin indica que la altura media de los 5000
rboles puede ser tan pequea como 57.24 o tan grande como 61.20 pulgadas. El numero total de pulgadas
para los 5000 rboles oscila entre (57.24) (5000) = 286200 y (61.20) (5000) = 306000. Si los rboles se venden
a $ 2.80 por pie , entonces el costo por pulgada es de $ 0.23. El valor de los rboles oscila entre (
286000)(0.23) = $ 65780 y (306000)(0.23) = $ 70380 con 95% de confianza
13.- Una muestra de 15 aves tomadas al azar en un establecimiento con 5000 aves, (que elabora alimentos
balanceados), permiti establecer un aumento de peso promedio de 90 g por semana y por ave, y un desvo
tpico de 10 g. Se busca estimar el incremento de peso promedio para las 5000 aves del establecimiento con
un intervalo de confianza del 90%.
Solucin
X = aumento de peso por ave
n = 15
= 90 g S = 10 g ICM0,90?
Por tabla:

y el intervalo resulta:

Intervalos de Confianza para Proporciones
14.- La encuesta de una muestra de 100 volantes ,elegidos aleatoriamente de todos los votantes de un
distrito, indica que 55 % de ellos estaban a favor de un candidato en particular. Calcule los limites de
confianza a) 95% , b) 99% y c) 99.73% para la proporcin de todos los volantes del candidato.
Solucin
a) Los limites de confianza a 95 % para la poblacin dada p son P 1.96 P
b) Los limites de confianza a 99 % para p son 0.55 2.58 =
0.55 0.13
c) Los limites de confianza a 99.73 % para p son 0.55 2.58 =
0.55 0.13
15.- Que tan grande debe ser una muestra de votantes , en el problema 9 para tener una confianza a) del
95% y b ) 99.73% de que el candidato ser electo ?
Solucin
Los limites de confianza para p son P zc =
0.55 zc = 0.55 0.50 zc donde se emplea el estimado P = p = 0.55 con base al problema anterior. Como el
candidato ganara solo si recibe mas de 50 5 de los votos de la poblacin se requiere que 0.50 zc / sea menor
que 0.05
a) Para el nivel de confianza a 95 %, 0.50 zc / = 0.50 (1.96 ) / = 0.05
b) Para el nivel de confianza a 99.73 %, 0.50 zc / = 0.50 (3) / =0.05
16.- En 40 lanzamientos de una moneda se obtuvieron 24 caras. Calcule los limites de confianza a) 95% y b)
99.73% para la proporcin de caras que se obtendrn en un numero ilimitado de lanzamientos de moneda.
Solucin
a) Al nivel de 95 % zc = 1.96 colocando P = 24 / 40 = 0.6 y N = 40
b) Al nivel del 99.73 % zc = 3 . Usando la formula del problema 10 se obtiene p = 0.37 y 0.79
Con la formula aproximadamente p = P zc / N se obtiene p = 0.60 0.23 produciendo el intervalo de 0.37 a
0.83
Intervalos de Confianza para Diferencias y Sumas
17.- Una muestra de 150 focos de la marca A mostr un promedio de vida de 1400 horas y una desviacin
estndar de 120 horas. Una muestra de 200 focos de la marca B mostr un promedio de vida de 1200 horas
y una desviacin estndar de 80 horas . Calcule los limites de confianza a) 95% y b) 99% para la diferencia de
medias de los promedios de vida para las poblaciones de las marcas A y B.
Solucin
a) Los limites de confianza a 95 % son :
1400 - 1200 1.96 = 510.82
b) Los limites de confianza de 99 5 son 1400 - 1200 2.58 /100= 200 32.6.
Luego se lograra una confianza de 99 5 en que la diferencia de medias poblacionales esta entre 167 y 233
horas.
18.- En una muestra aleatoria de 400 adultos y 600 adolescentes que vieron programa de televisin , 100
adultos y 300 adolescentes manifestaron que les gusto. Construya limites de confianza a) 95% b) 99% para
la diferencia de proporciones de todos los adultos y todos los adolescentes que vieron el programa y les
gusto.
Solucin
Los limites de confianza para la diferencia de proporciones de los dos grupos estn dados por :
P1 - P2 Zc
Donde los subndices 1 y 2 se refieren a los adolescentes y a los adultos respectivamente :
Los limites de confianza a 95 % son : 0.50 - 0.25 1.96 = 0.25 0.06
b) Los limites de confianza a 99 5 son : 0.50 - 0.25 2.58 = 0.25 0.08
19.- La fuerza automotriz media de bateras producidas por una compaa es de 45.1 voltios V y la
desviacin estndar es de 0.04 V. Si cuatro de dichas bateras se conectan en serie, calcule los limites de
confianza a) 95%, b) 99%, c)a 99.73 % y d) 50% de la fem total.
Solucin
Si E1 , E2 , E3 y E4 representan la fem de las cuatro bateras entonces se tiene :
Los limites de confianza a 95 % son 180.4 1.96(0.80) = 180.4 0.16 V
Los limites de confianza a 99 % son 180.4 2.58(0.80) = 180.4 0.21 V
Los limites de confianza a 99.73 % son 180.4 3(0.80) = 180.4 0.24 V
Los limites de confianza a 50% son 180.4 0.6745(0.80) = 180.4 0.054 V
Intervalos de Confianza para la Desviacin Estndar
20.- Se calculo que la desviacin estndar de las vidas medias de una muestra de 200 focos de 100 h. Calcule
los limites de confianza a) 95%, b) 99% para la desviacin estndar .
Solucin
Los limites de confianza para la desviacin estndar poblacional estn dados por s zc / " 2N = donde
zc indica el nivel de confianza.Se utiliza la desviacin estndar muestral para estimar .
Los limites de confianza a 95 % son 100 1.96(100)/" 400 = 100 9.8
21.- De que tamao debe ser la muestra de focos del problema 15 para tener un nivel de confianza de
99.73% en que la desviacin estndar poblacional verdadera no difiera de la desviacin estndar muestral
por mas de a) 5% y b) 10 %
Solucin
Los limites de confianza de 99% para son 3 / = s 3s/ ,usando s como un estimado de .El porcentaje de
error en la desviacin estndar es :
Si 300/ = 5 entonces N = 1800. Por lo tanto , el tamao de la muestra debe ser de 1800 o mas .
Si 300/ = 10; as N = 450. Por lo tanto , el tamao de la muestra debe ser de 450 o mas .
Error Probable
22.- El voltaje de 50 bateras del mismo tipo tiene una media de 18.2 V y una desviacin estndar de 0.5 V .
Calcule a) el error probable de la media y b) los limites de confianza de 50%.
Solucin
Error probable de la media = 0.674x = 0.6745 / = 0.6475 s/ =
0.6745 s / =
23.- Una medicin fue registrada como 216.480 gramos con un error probable de 0.272 g Cuales son los
limites de confianza a 95% para la medicin ?
Solucin
El error probable es 0.272 = 0.672 x o x = 0.272/ 0.6745. Por lo tanto, los limites de confianza a 95% son x
1.96 x = 216.480 1.96( 0.272/ 0.6745 ) = 216.480 0.790 gramos
24.- En una muestra de 100 pacientes sometidos a un cierto tratamiento se obtienen 80 curaciones. Calcular el
intervalo de confianza al 95% de la eficacia del tratamiento.
25.- En una muestra aleatoria de 90 pacientes se mide el nivel de glucosa en sangre en ayunas. Se
obtiene
= 132 mg/dl y s2=109. Construir el IC al 95% para Qu asuncin se ha hecho?
Solucin
Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo. Se eligen
aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la gripe. Construir un IC al 95%
para la probabilidad de pasar la gripe si se est vacunado. En los otros 100 pacientes sin vacunar la pasan 20.
26.- En una muestra de seis mediciones , los registros de un cientfico para el dimetro de una esfera fueron
6.33, 6.37, 6.32, 6.37 y 6.38 centmetros. Determine la varianza verdadera. La media es de 6.35
a) .- El estimado sin sesgo y eficiente de la varianza verdadera , es decir la varianza poblacional es :
2 = ( N / N - 1 ) s2
(6.33 - 6.35 )2 + ( 6.37 - 6.35 ) 2 + ( 6.32 - 6.35 ) 2 + ( 6.37 - 6.35 )2 + (6.38 - 6.35 )/ 6 - 1 = 6 x 10 -4
27.- Para medir el tiempo de reaccin ,un psiclogo estima que la desviacin estndar de 0.48 segundos
Que tan grande debe ser una muestra de mediciones para tener a) 95 % y b) 99 % de confianza en que el
error de este estimado no exceder de 0.01 segundos ?
Solucin
a) Los limites de confianza a 95 % son de x 1.96 / con el error de estimacin 1.96 / tomando = s = 0.05
segundos se debe ver que el error ser igual a 0.01 segundos si ( 1.96) ( 0.05 )/ = ( 1.96 ) ( 0.48 )/ 0.01 = 94.08
o N = 94.08
b) Los limites de confianza a 99 % son x 2.58 /
28.- La encuesta de una muestra de 400 volantes ,elegidos aleatoriamente de todos los votantes de un
distrito, indica que 60 % de ellos estaban a favor de un candidato en particular. Calcule los limites de
confianza a) 95% , b) 99% y c) 99.73% para la proporcin de todos los volantes del candidato.
Solucin
a) Los limites de confianza a 95 % para la poblacin dada p son P 1.96 P
b) Los limites de confianza a 99 % para p son 0.55 2.58 =
0.55 0.13
c) Los limites de confianza a 99.73 % para p son 0.55 2.58 =
0.55 0.13
29.- En una muestra de cinco mediciones , los registros de un cientfico para el dimetro de una esfera
fueron 5.33, 6.37, 6.33, 6.38 centmetros. Determine estimados sin sesgo y eficientes de a) la media
verdadera
Solucin
a).- el estimado sin sesgo y eficiente de la media verdadera , es decir , la media poblacional es :
x = x / N = 5.33 + 6.37 + 6.36 +6.33 + 6.38 / 5 = 6.154 cm
30.- En 80 lanzamientos de una moneda se obtuvieron 12 caras. Calcule los limites de confianza a) 95% para
la proporcin de caras que se obtendrn en un numero ilimitado de lanzamientos de moneda.
Solucin
a) Al nivel de 95 % zc = 1.96 colocando P = 12 / 80 = 0.15 y N = 80
31.- En 100 lanzamientos de una moneda se obtuvieron 24 caras. Calcule los limites de confianza a) 95% y
para la proporcin de caras que se obtendrn en un numero ilimitado de lanzamientos de moneda.
Solucin
a) Al nivel de 95 % zc = 1.96 colocando P = 24 / 100 = 0.24 y N = 100
32.- Queremos estudiar la influencia que puede tener el tabaco con el peso de los nios al nacer. Para ello se
consideran dos grupos de mujeres embarazadas (unas que fuman un paquete al da y otras que no) y se
obtienen los siguientes datos sobre el peso X, de sus hijos:
En ambos grupos los pesos de los recin nacidos provienen de sendas distribuciones normales de medias
desconocidas, y con varianzas que si bien son desconocidas, podemos suponer que son las mismas. Calcular en
cuanto influye el que la madre sea fumadora en el peso de su hijo.
Solucin
Si X1 es la v.a. que describe el peso de un nio que nace de madre no fumadora, y X2 el de un hijo de madre
fumadora, se tiene por hiptesis que

Si queremos estimar en cuanto influye el que la madre sea fumadora en el peso de su hijo, podemos estimar
un intervalo de confianza para
, lo que nos dar la diferencia de peso esperado entre un nio del primer grupo y otro del segundo. El
estadstico que se ha de aplicar para esta cuestin es:

donde :
33.- En una muestra de siete mediciones , los registros de un cientfico para el dimetro de una esfera fueron
6.33, 6.37, 6.32, 6.37, 6.38 y 6.39 centmetros. Determine estimados sin sesgo y eficientes de a) la media
verdadera y b) la varianza verdadera.
Solucin
a).- el estimado sin sesgo y eficiente de la media verdadera , es decir , la media poblacional es :
x = x / N = 6.33 + 6.37 + 6.36 +6.32 + 6.37 + 6.38 + 6.39 / 7 = 6.36 cm
b).- El estimado sin sesgo y eficiente de la varianza verdadera , es decir la varianza poblacional es :
2 = ( N / N - 1 ) s2
(6.33 - 6.36 )2 + ( 6.37 - 6.36 ) 2 + ( 6.32 - 6.36 ) 2 + ( 6.37 - 6.36 )2 + ( 6.38 - 6.36 )2 + ( 6.39 - 6.36 )2/ 7 - 1
= 6.66 x 10 - 4 cm2
34.- Una empresa de rboles navideos tienen 5015 rboles listos para cortarse. Se seleccionan
aleatoriamente cien de estos rboles y se mide su altura. Las alturas, en pulgadas se muestran en la
siguiente tabla. Utilice minitab para establecer un intervalo de confianza a 95% de la altura media a los
5015 rboles. Si estos se venden a $ 2.80 por pie de un limite superior y uno inferior sobre el valor de los
5015 rboles .
70 61 52 62 63 34 47 35 44 52
70 61 65 51 65 72 55 71 57 75
53 48 55 67 60 60 73 74 43 74
71 53 78 59 56 62 48 65 68 51
73 62 80 53 64 44 67 45 58 48
50 57 72 55 56 62 72 57 49 62
46 61 52 46 72 56 46 48 57 52
54 73 71 70 66 67 58 71 75 50
44 59 56 54 63 43 68 69 55 63
48 49 70 60 68 47 49 69 66 80
Solucin
El intervalo de confianza del minitab presentado a continuacin indica que la altura media de los 5000
rboles puede ser tan pequea como 57.24 o tan grande como 61.20 pulgadas. El numero total de pulgadas
para los 5000 rboles oscila entre (57.24) (5015) = 287058.6 y (61.20) (5015) = 306918. Si los rboles se
venden a $ 2.80 por pie , entonces el costo por pulgada es de $ 0.23. El valor de los rboles oscila entre (
286000)(0.23) = $ 65780 y (306000)(0.23) = $ 70380 con 95% de confianza
35.- En 50 lanzamientos de una moneda se obtuvieron 12 caras. Calcule los limites de confianza a) 95% para
la proporcin de caras que se obtendrn en un numero ilimitado de lanzamientos de moneda.

Potrebbero piacerti anche