Unidad 4 Probabilidad

Instituto Tecnológico Superior de Uruapan
Ingeniería Civil
Probabilidad y Estadística.
Inferencia Estadística.
Álvarez Martínez Edgar

2do semestre
18040649
Ing. Karla Liliana Licea Rivas

5 de junio del 2019
1
Introducción
En esta investigación se abordará la cuarta unidad de la materia de Probabilidad y Estadística,
titulado Inferencia Estadística. Primero que nada, el principal objetivo de la Estadística es inferir
o estimar características de una población que no es completamente observable (o no interesa
observarla en su totalidad) a través del análisis de una parte de ella a la que llamamos muestra. Lo
que se hace entonces es analizar la muestra y extrapolar conclusiones desde la muestra a la
población. Ahora bien, para considerar válidas en la población las conclusiones obtenidas en la
muestra, ésta ha de representar bien a la población.
La Inferencia Estadística se puede clasificar en inferencia paramétrica e inferencia no paramétrica.
La inferencia paramétrica tiene lugar cuando se conoce la distribución de la variable de estudio en
la población, y el interés recae sobre los parámetros desconocidos de la misma. La inferencia no
paramétrica tiene lugar si no se conoce la distribución y sólo se suponen propiedades generales de
la misma. Nosotros nos centramos en la inferencia paramétrica, y nuestro objetivo será inferir o
estimar parámetros poblacionales a partir de la información que nos proporciona una muestra.
2
4.1.- Estimación puntual y por intervalos de confianza
En la primera se busca que con base a los datos muéstrales de origen a una estimulación evaluada
del parámetro y que recibe el nombre de estimador puntual. Para la segunda se determina un
intervalo en la que forma probable se encuentre el valor de parámetro y recibe el nombre de
intervalo de confianza.
El problema de estimación puntual consiste en, seleccionada una muestra X 1 ,..., X n encontrar el
estadístico T ( X1 ,..., X n ) que mejor estime el parámetro θ. Una vez observada o realizada la
muestra, con valores

x1 ,..., xn , se obtiene la estimación puntual de θ T ( x1 ,..., xn )   .
Existen dos métodos para determinar la estimación puntual de un parámetro, estas son:
 Método de los momentos: consiste en igualar momentos poblacionales a momentos
muestrales. Deberemos tener tantas igualdades como parámetros a estimar.
Momento poblacional de orden r

r  E( X r )
X r
k
r  k 1
Momento muestral de orden r n
 Método de máxima verosimilitud: consiste en tomar como valor del parámetro aquel que
maximice la probabilidad de que ocurra la muestra observada.
n
L ( x1 ,..., xn )   f ( xk )
k 1
Buscamos entonces el valor de θ que maximice la función de verosimilitud, y al valor obtenido se
le llama estimación por máxima verosimilitud de θ.

3
Veamos un ejemplo para clarificar mejor lo anteriormente dicho.
Ejemplo.- Sea X  N (  ,  ) , con  desconocido. Seleccionada una m.a.s. X 1 ,..., X n con
realización x1 ,..., xn , estimamos el parámetro  por ambos métodos.
Según el método de los momentos:
X k
E( X )  k 1
X
n
Y al ser   E ( X ) se obtiene que   x .
Por el método de máxima verosimilitud:
n
L ( x1 ,..., xn )   f  ( xk )
k 1
 ( xk   )2
n 2 2
e
L ( x1 ,..., xn )  
k 1 2
Y ahora, se necesita maximizar en  tal función. Aunque es más sencillo aplicando un logaritmo
a ambos lados de la igualdad:
n
1
ln L ( x1 ,..., xn )  
2 2  (x
k 1
k   ) 2  n ln( 2 )
4
 1 n

ln L ( x1 ,..., xn )  2

 (x
k 1
k  )
 nx  n
ln L ( x1 ,..., xn )  0  x
 o 2
En muchos casos la estimación puntual no es suficiente en el sentido de que no nos indica el error
que se comete en dicha estimación.
Lo razonable en la práctica es adjuntar, junto a la estimación puntual del parámetro, un cierto
intervalo numérico que mida el margen de error que, de acuerdo a las observaciones muestrales,
pueda tener dicha estimación.
La idea de Intervalo de Confianza, es proponer un rango de valores entre los que posiblemente se
encuentre el verdadero valor del parámetro θ.
En pocas palabras, La estimación por intervalos de confianza consiste en determinar un posible
rango de valores o intervalo, en los que pueda precisarse –con una determinada probabilidad– que
el valor de un parámetro se encuentra dentro de esos límites.
Construcción de un Intervalo de Conﬁanza (I.C.)
Sea X  F , con θ desconocido. Seguimos los siguientes pasos para construir un I.C. para θ:
1. Seleccionamos una m.a.s. X 1 ,..., X n
2. Buscamos un estadístico que incluya el parámetro a estimar θ y que tenga distribución conocida.
3. Fijamos el nivel de conﬁanza (1−α).
4. Encontramos  ( x1 ,..., xn ) y  ( x1 ,..., xn ) tal que

5

P  ( x1 ,..., xn )     ( x1 ,..., xn )  1   
Diremos entonces que  ( x1 ,..., xn ), ( x1 ,..., xn )  es un I.C. para θ al (1   ) 100% de confianza.
Eso significa que de cada 100 intervalos que pudieran obtenerse, (1   ) 100 contendrían el
verdadero valor del parámetro θ.
Ejemplo.- Supongamos que llevan a cabo pruebas de la resistencia a la tensión de una clase de
largueros de aluminio utilizado en la fabricación de alas de aeroplanos. De la experiencia se
considera una desviación típica de 1 kg/mm2. Una muestra de 10 largueros proporciona una
resistencia promedio de 87.6 kg/mm. Vamos a obtener un I.C. al 95% de confianza para la
resistencia promedio de esta clase de largueros.
X  Resistencia a la tensión  N (  ,1)
  
Sabemos que el I.C. al (1   )100% es  x  0 z   . En este caso, el nivel de confianza es del
 n 1 2 
95%, por lo que (1   )  0.95 y   0.05 . El intervalo resulta por lo tanto:
 0   1.96 
x  z    87.6    86.98,88.22
 n 1 2   10 
4.2.- Estimación de la media, de la diferencia de medidas, de la proporción y de la
diferencia de proporciones
Como se ha señalado uno de los métodos para estimar la media de una población es a través de
intervalos de confianza. Existen dos fórmulas para poder estimar la media de una población a
través de intervalos de confianza y el uso de cada una de ellas depende del caso que se examine.
6
El intervalo de confianza, para la media de una población, con un nivel de confianza de 1- α, siendo
X la media de una muestra de tamaño n y σ la desviación típica de la población, es:
   
 X  z , X  z 
 2 n 2 n 
El error máximo de estimación es:

E  z
2 n
 Cuanto mayor sea el tamaño de la muestra, n, menor es el error.
 Cuanto mayor sea el nivel de confianza, 1-α, mayor es el error.
Tamaño de la muestra:
2
 z 
n 2  
 E 
 
 
 Si aumentamos el nivel de confianza, aumenta el tamaño de la muestra.
 Si disminuimos el error, tenemos que aumentar el tamaño de la muestra.
Si se tienen dos poblaciones con medias 1 y  2 varianzas  12 y  22 , respectivamente, un
estimador puntual de la diferencia entre 1 y  2 está dado por la estadística x1  x2 . Por tanto.
Para obtener una estimación puntual de 1  2 , se seleccionan dos muestras aleatorias

7
independientes, una de cada población, de tamaño n1 y n2 , se calcula la diferencia x1  x2 de las
medias muestrales.
Recordando a la distribución muestral de diferencia de medias:
z
 x  x   m  m 
1 2 1 2
s12 s22

n1 n2
Al despejar de esta ecuación 1  2 , se obtiene lo siguiente:

m1  m2  x1  x2  z
s12 s22

n1 n2

En el caso en que se desconozcan las varianzas de la población y los tamaños de muestra sean
mayores a 30 se podrá utilizar la varianza de la muestra como una estimación puntual.
En una estimación de la proporción, sucede lo siguiente. Sea X una variable binomial de
parámetros n y p (una variable binomial es el número de éxitos en n ensayos; en cada ensayo la
probabilidad de éxito (p) es la misma, Si n es grande y p no está próximo a 0 o 1 ( np  5 ) X es
aproximadamente normal con media np y varianza npq (siendo q = 1 - p) y se puede usar el
estadístico:
8
X
p
n
pq
Que es también aproximadamente normal, con error típico dado por en consecuencia, un IC
n
para p al 100(1   )% será:
pq
p  z
2 n
Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se puede
establecer un intervalo de confianza para P al considerar la distribución muestral de proporciones.
pP
z
pq
n
pq
P  pz
n
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el
procedimiento del intervalo de confianza que se establece aquí no es confiable, por tanto, no se
debe utilizar. Para estar seguro, se debe requerir que np ó nq sea mayor o igual a 5.
El error de estimación será la diferencia absoluta entre p y P, y podemos tener el nivel de confianza
pq
de que esta diferencia no excederá z
n
9
Para la estimación de diferencia de proporciones Para este caso en particular se utilizará la
distribución muestral de diferencia de proporciones para la estimación de las mismas. Recordando
la fórmula:
z
 p1  p2    P1  P2 
Pq Pq
1 1
 2 2
n1 n2
Y de aquí, se despeja P1  P2 :
Pq P2 q2
P1  P2   p1  p2   z 1 1

n1 n2
Aquí se tiene el mismo caso que en la estimación de una proporción, ya que al hacer el despeje
nos queda las dos proporciones poblacionales y es precisamente lo que queremos estimar.
4.3.- Determinación del tamaño de la muestra
MEDIA.- ¿Qué tan grande debe ser una muestra si la media muestral se va a usar para estimar la
media poblacional? La respuesta depende del error estándar de la media, si este fuera cero,
entonces se necesitaría una sola media que será igual necesariamente a la media poblacional
desconocida µ, porque σ = 0. El error máximo de estimación está dado por:
zs

n
10
Si se eleva al cuadrado ambos lados de esta ecuación y se despeja n de la ecuación resultante,
obtenemos:
2
 zs 
n 
 e 
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación
se convierte en:
zs N n

n N 1
z 2s2 N
n 2
e ( N  1)  z 2 s 2
PROPORCIÓN.- Se desea saber que tan grande se requiere que sea una muestra para asegurar que
el error al estimar P sea menor que una cantidad específica ε
pq
ez
n
z 2 pq
n 2
e
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación
se convierte en:
11
pq N  n
ez
n N 1
z 2 pqN
n 2
e ( N  1)  z 2 pq
DIFERENCIA DE MEDIAS.- la distribución muestral de diferencia de medias se tiene que error
está dado por:
s12 s22
e 
n1 n2
En esta ecuación se nos pueden presentar dos casos:
 Los tamaños de muestra son iguales.
 Los tamaños de muestra son diferentes
Para el primer caso, no hay ningún problema, se eleva al cuadrado y despejamos n
z 2 ( s12  s22 )
n
e2
Para el segundo caso, debemos poner una n en función de otra y que una población sea mayor
que otra y sepamos cuantas veces.
z 2 ( s12  ks22 )
n2 
ke2
12
DIFERENCIA DE PROPORCIONES.- la distribución muestral de diferencia de medias se tiene
que error está dado por:
p1q1 p2 q2
ez 
n1 n2
Y al igual que en la diferencia de medias, presentan los mismos casos. Por lo tanto las fórmulas
quedan de esta forma:
z 2 ( p1q1  p2 q2 )
n
CASO 1
e2
z 2 ( p1q1  kp2 q2 )
n2 
CASO 2
ke2
4.4.- Prueba de hipótesis
El propósito de la prueba de hipótesis es determinar si un valor propuesto (hipotético) para un parámetro
poblacional, por ejemplo para una media, debe aceptarse como plausible con base en la evidencia
muestral. El concepto de la prueba de hipótesis también se puede utilizar para probar hipótesis en relación
con datos cualitativos. Se han desarrollado tres métodos para pruebas de hipótesis, todos ellos
conducentes a la misma decisión cuando se usan los mismos estándares de probabilidad y de riesgo.
PRUEBA DE HIPÓTESIS DE PROPORCIÓN.- Las pruebas de grandes muestras de medias y
proporciones son bastante semejantes. De este modo, los valores estadísticos de prueba miden la
desviación de un valor estadístico de muestra a partir de un valor propuesto. Y ambas pruebas se

13
basan en la distribución normal estándar para valores críticos. Quizá la única diferencia real entre
las ambas radica en la forma corno se obtiene la desviación estándar de la distribución de muestreo.
Esta prueba comprende el cálculo del valor estadístico de prueba Z:
x
 p0
Z prueba  n
p0 (1  p0 )
n
Si se muestrea a partir de una población finita
n
100%  5%
N
Se debe utilizar el factor finito de corrección
x
 p0
Z prueba  n
p0 (1  p0 ) N  n
n N 1
El tipo de prueba refleja H1 . Por ejemplo, hay tres posibilidades para H1 :
H1 : p  p0
H1 : p  p0
H1 : p  p0
14
La hipótesis nula es:
H1 : p  p0
La primera alternativa establece una prueba de cola derecha; la segunda, izquierda y la tercera, una
prueba de dos colas.
PRUEBA DE HIPÓTESIS DE UNA MEDIA.- Si se conoce la desviación estándar de la
población (  ), la distribución de muestreo adecuada es la distribución normal. Si la población que
se muestra es normal, la distribución de muestreo será normal en el caso de todos los tamaños de
la muestra y el valor estadístico de prueba a utilizar es:
x
Z prueba 

n
Si la población no es normal, o si se desconoce su forma, se emplea la ecuación anterior
solamente para tamaños de muestra iguales o mayores 30, es decir, para n  30
Si no se conoce la desviación estándar de la población (  ), el valor estadístico de prueba es:
x
t prueba 
S
n
En este caso se debe usar el factor finito de corrección para modificar las desviaciones estándar,
por lo tanto se aplican las siguientes ecuaciones para  conocida y desconocida:

15
x x
Z prueba  t prueba 
 N n S N n
n N 1 n N 1
4.5.- Muestras pequeñas
Para la media poblacional y sus muestras pequeñas, cuando el número de observaciones es menor
a 30, la estimación del intervalo se basa en las suposiciones que si la población es normal o que si
se conoce la desviación estándar de la población.
En caso que la muestra sea pequeña, menor de 30, y se conozca la varianza de la población  2 , el
intervalo de confianza es:
 
X  Z    X  Z
2 n 2 n
Cuando el tamaño de la muestra sea pequeño y no se conozca la varianza poblacional  2 , se
utiliza la desviación estándar de la muestra s y la distribución de probabilidad t.
Cuando no se conoce la varianza poblacional, se utiliza el intervalo de confianza, que es el
siguiente:
s s  s s 
X  t    X  t ; P  X  t    X  t   1 
2 n 2 n  2 n 2 n
16
Para la proporción proporcional, todo el análisis para la estimación de la proporción poblacional
para muestras grandes se aplica para determinar la proporción poblacional para muestras pequeñas.
p(1  p) p(1  p)  p(1  p) p(1  p) 

p t    pt ; Pp t    pt   1 
n n  n n 
En la prueba para una media poblacional con muestra pequeña y desviación estándar poblacional
desconocida se utiliza el valor estadístico t.
x
t
S
n
17
Conclusión / retroalimentación
Concluyendo con esta investigación, debo de decir que, como en anteriores investigaciones,
aprendí algo nuevo y que sé que esto me va a servir en un futuro. Tuve varias complicaciones a la
hora de estar buscando información acerca de este tema. Sin embargo, logré recaudar la mayor
parte de la información posible para lograr que este trabajo pueda ser comprendido de una manera
mejor.
Decidí proponer una retroalimentación sobre este trabajo y a la vez, una conclusión, aprovechando
que puedo desenvolverme un poco más en esta parte y además, contar mi experiencia realizando
esta pequeña investigación
Ahora, puedo concluir diciendo que este tema de la unidad cuatro es un poco extenso pero pudo
resumirse de gran forma, sin perder la coherencia a lo que se explica. Como vimos, existen muchas
formas de calcular las estimaciones de una media, de una proporción y de diferencias. Así como
existen tamaños de muestras que influirán en los resultados que nosotros calcularíamos sobre una
población. En sí, es un poco complejo explicar del todo la esencia de este tema, pero con la práctica
se puede lograr comprender y, con más tiempo, dominarlo.
Al ya estar entrando en la estadística, me doy cuenta de que esto puede servir mucho para mi
carrera, por ejemplo para el cálculo de materiales necesarios, el dinero que debe invertirse o la
cantidad de empleados y probabilidades que puedan existir en una obra.

18
Referencias
Bibliografía
Benitez Morales, A. (s.f.). Universidad Autónoma del Estado de Hidalgo. Obtenido de
http://cidecame.uaeh.edu.mx/lcc/mapa/PROYECTO/libro19/index.html
Fallas, J. (2012). Obtenido de http://www.ucipfg.com/Repositorio/MGAP/MGAP-05/BLOQUE-

ACADEMICO/Unidad-2/complementarias/prueba_hipotesis_2012.pdf
Instituto Tecnológico de Chihuahua. (s.f.). Obtenido de

http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/u0102.pdf
Lombardía Cortiña, M. J. (s.f.). (U. d. Coruña, Ed.) Obtenido de

eio.usc.es/eipc1/base/BASEMASTER/FORMULARIOS-
PHP/MATERIALESMASTER/Mat_41855_T3IC.pdf
Universidad de Jaén. (s.f.). Estimación Puntual y por Intevalos de Confianza. Obtenido de

http://www4.ujaen.es/~dmontoro/Metodos/Temas/Tema7.pdf
Vargas Barrera, R. (2008). Estadística II. Bogotá, Colombia: Escuela Superior de Administración Pública.
Obtenido de http://www.esap.edu.co/portal/wp-content/uploads/2017/10/6-Estadstica-ii.pdf

Unidad 4 Probabilidad

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Unidad 4 Probabilidad

Caricato da

Copyright:

Formati disponibili

Instituto Tecnológico Superior de Uruapan

Álvarez Martínez Edgar

Ing. Karla Liliana Licea Rivas

En esta investigación se abordará la cuarta unidad de la materia de Probabilidad y Estadística,

o estimar características de una población que no es completamente observable (o no interesa

que se hace entonces es analizar la muestra y extrapolar conclusiones desde la muestra a la

muestra, ésta ha de representar bien a la población.

La Inferencia Estadística se puede clasificar en inferencia paramétrica e inferencia no paramétrica.

La inferencia paramétrica tiene lugar cuando se conoce la distribución de la variable de estudio en

la población, y el interés recae sobre los parámetros desconocidos de la misma. La inferencia no

paramétrica tiene lugar si no se conoce la distribución y sólo se suponen propiedades generales de

4.1.- Estimación puntual y por intervalos de confianza

intervalo en la que forma probable se encuentre el valor de parámetro y recibe el nombre de

muestra, con valores

 Método de los momentos: consiste en igualar momentos poblacionales a momentos

muestrales. Deberemos tener tantas igualdades como parámetros a estimar.

Momento poblacional de orden r

Momento muestral de orden r n

maximice la probabilidad de que ocurra la muestra observada.

Buscamos entonces el valor de θ que maximice la función de verosimilitud, y al valor obtenido se

le llama estimación por máxima verosimilitud de θ.

Veamos un ejemplo para clarificar mejor lo anteriormente dicho.

Ejemplo.- Sea X  N (  ,  ) , con  desconocido. Seleccionada una m.a.s. X 1 ,..., X n con

realización x1 ,..., xn , estimamos el parámetro  por ambos métodos.

Según el método de los momentos:

Y al ser   E ( X ) se obtiene que   x .

Por el método de máxima verosimilitud:

a ambos lados de la igualdad:

que se comete en dicha estimación.

Lo razonable en la práctica es adjuntar, junto a la estimación puntual del parámetro, un cierto

pueda tener dicha estimación.

encuentre el verdadero valor del parámetro θ.

En pocas palabras, La estimación por intervalos de confianza consiste en determinar un posible

el valor de un parámetro se encuentra dentro de esos límites.

Construcción de un Intervalo de Conﬁanza (I.C.)

1. Seleccionamos una m.a.s. X 1 ,..., X n

3. Fijamos el nivel de conﬁanza (1−α).

4. Encontramos  ( x1 ,..., xn ) y  ( x1 ,..., xn ) tal que

verdadero valor del parámetro θ.

largueros de aluminio utilizado en la fabricación de alas de aeroplanos. De la experiencia se

resistencia promedio de esta clase de largueros.

X  Resistencia a la tensión  N (  ,1)

95%, por lo que (1   )  0.95 y   0.05 . El intervalo resulta por lo tanto:

4.2.- Estimación de la media, de la diferencia de medidas, de la proporción y de la

X la media de una muestra de tamaño n y σ la desviación típica de la población, es:

 Cuanto mayor sea el tamaño de la muestra, n, menor es el error.

 Cuanto mayor sea el nivel de confianza, 1-α, mayor es el error.

 Si disminuimos el error, tenemos que aumentar el tamaño de la muestra.

Si se tienen dos poblaciones con medias 1 y  2 varianzas  12 y  22 , respectivamente, un

Para obtener una estimación puntual de 1  2 , se seleccionan dos muestras aleatorias

independientes, una de cada población, de tamaño n1 y n2 , se calcula la diferencia x1  x2 de las

Recordando a la distribución muestral de diferencia de medias:

Al despejar de esta ecuación 1  2 , se obtiene lo siguiente:

mayores a 30 se podrá utilizar la varianza de la muestra como una estimación puntual.

En una estimación de la proporción, sucede lo siguiente. Sea X una variable binomial de

parámetros n y p (una variable binomial es el número de éxitos en n ensayos; en cada ensayo la

probabilidad de éxito (p) es la misma, Si n es grande y p no está próximo a 0 o 1 ( np  5 ) X es

aproximadamente normal con media np y varianza npq (siendo q = 1 - p) y se puede usar el

para p al 100(1   )% será:

Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se puede

establecer un intervalo de confianza para P al considerar la distribución muestral de proporciones.

Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el

Para la estimación de diferencia de proporciones Para este caso en particular se utilizará la

distribución muestral de diferencia de proporciones para la estimación de las mismas. Recordando