Sei sulla pagina 1di 19

Instituto Tecnológico Superior de Uruapan

Ingeniería Civil

Probabilidad y Estadística.

Inferencia Estadística.

Álvarez Martínez Edgar


2do semestre
18040649

Ing. Karla Liliana Licea Rivas


5 de junio del 2019
1

Introducción

En esta investigación se abordará la cuarta unidad de la materia de Probabilidad y Estadística,

titulado Inferencia Estadística. Primero que nada, el principal objetivo de la Estadística es inferir

o estimar características de una población que no es completamente observable (o no interesa

observarla en su totalidad) a través del análisis de una parte de ella a la que llamamos muestra. Lo

que se hace entonces es analizar la muestra y extrapolar conclusiones desde la muestra a la

población. Ahora bien, para considerar válidas en la población las conclusiones obtenidas en la

muestra, ésta ha de representar bien a la población.

La Inferencia Estadística se puede clasificar en inferencia paramétrica e inferencia no paramétrica.

La inferencia paramétrica tiene lugar cuando se conoce la distribución de la variable de estudio en

la población, y el interés recae sobre los parámetros desconocidos de la misma. La inferencia no

paramétrica tiene lugar si no se conoce la distribución y sólo se suponen propiedades generales de

la misma. Nosotros nos centramos en la inferencia paramétrica, y nuestro objetivo será inferir o

estimar parámetros poblacionales a partir de la información que nos proporciona una muestra.
2

4.1.- Estimación puntual y por intervalos de confianza

En la primera se busca que con base a los datos muéstrales de origen a una estimulación evaluada

del parámetro y que recibe el nombre de estimador puntual. Para la segunda se determina un

intervalo en la que forma probable se encuentre el valor de parámetro y recibe el nombre de

intervalo de confianza.

El problema de estimación puntual consiste en, seleccionada una muestra X 1 ,..., X n encontrar el

estadístico T ( X1 ,..., X n ) que mejor estime el parámetro θ. Una vez observada o realizada la

muestra, con valores


x1 ,..., xn , se obtiene la estimación puntual de θ T ( x1 ,..., xn )   .

Existen dos métodos para determinar la estimación puntual de un parámetro, estas son:

 Método de los momentos: consiste en igualar momentos poblacionales a momentos

muestrales. Deberemos tener tantas igualdades como parámetros a estimar.

Momento poblacional de orden r


r  E( X r )

X r
k
r  k 1

Momento muestral de orden r n

 Método de máxima verosimilitud: consiste en tomar como valor del parámetro aquel que

maximice la probabilidad de que ocurra la muestra observada.

n
L ( x1 ,..., xn )   f ( xk )
k 1

Buscamos entonces el valor de θ que maximice la función de verosimilitud, y al valor obtenido se

le llama estimación por máxima verosimilitud de θ.


3

Veamos un ejemplo para clarificar mejor lo anteriormente dicho.

Ejemplo.- Sea X  N (  ,  ) , con  desconocido. Seleccionada una m.a.s. X 1 ,..., X n con

realización x1 ,..., xn , estimamos el parámetro  por ambos métodos.

Según el método de los momentos:

X k
E( X )  k 1
X
n

Y al ser   E ( X ) se obtiene que   x .

Por el método de máxima verosimilitud:

n
L ( x1 ,..., xn )   f  ( xk )
k 1
 ( xk   )2
n 2 2
e
L ( x1 ,..., xn )  
k 1 2

Y ahora, se necesita maximizar en  tal función. Aunque es más sencillo aplicando un logaritmo

a ambos lados de la igualdad:

n
1
ln L ( x1 ,..., xn )  
2 2  (x
k 1
k   ) 2  n ln( 2 )
4

 1 n


ln L ( x1 ,..., xn )  2

 (x
k 1
k  )

 nx  n
ln L ( x1 ,..., xn )  0  x
 o 2

En muchos casos la estimación puntual no es suficiente en el sentido de que no nos indica el error

que se comete en dicha estimación.

Lo razonable en la práctica es adjuntar, junto a la estimación puntual del parámetro, un cierto

intervalo numérico que mida el margen de error que, de acuerdo a las observaciones muestrales,

pueda tener dicha estimación.

La idea de Intervalo de Confianza, es proponer un rango de valores entre los que posiblemente se

encuentre el verdadero valor del parámetro θ.

En pocas palabras, La estimación por intervalos de confianza consiste en determinar un posible

rango de valores o intervalo, en los que pueda precisarse –con una determinada probabilidad– que

el valor de un parámetro se encuentra dentro de esos límites.

Construcción de un Intervalo de Confianza (I.C.)

Sea X  F , con θ desconocido. Seguimos los siguientes pasos para construir un I.C. para θ:

1. Seleccionamos una m.a.s. X 1 ,..., X n

2. Buscamos un estadístico que incluya el parámetro a estimar θ y que tenga distribución conocida.

3. Fijamos el nivel de confianza (1−α).

4. Encontramos  ( x1 ,..., xn ) y  ( x1 ,..., xn ) tal que


5


P  ( x1 ,..., xn )     ( x1 ,..., xn )  1   
Diremos entonces que  ( x1 ,..., xn ), ( x1 ,..., xn )  es un I.C. para θ al (1   ) 100% de confianza.

Eso significa que de cada 100 intervalos que pudieran obtenerse, (1   ) 100 contendrían el

verdadero valor del parámetro θ.

Ejemplo.- Supongamos que llevan a cabo pruebas de la resistencia a la tensión de una clase de

largueros de aluminio utilizado en la fabricación de alas de aeroplanos. De la experiencia se

considera una desviación típica de 1 kg/mm2. Una muestra de 10 largueros proporciona una

resistencia promedio de 87.6 kg/mm. Vamos a obtener un I.C. al 95% de confianza para la

resistencia promedio de esta clase de largueros.

X  Resistencia a la tensión  N (  ,1)

  
Sabemos que el I.C. al (1   )100% es  x  0 z   . En este caso, el nivel de confianza es del
 n 1 2 

95%, por lo que (1   )  0.95 y   0.05 . El intervalo resulta por lo tanto:

 0   1.96 
x  z    87.6    86.98,88.22
 n 1 2   10 

4.2.- Estimación de la media, de la diferencia de medidas, de la proporción y de la

diferencia de proporciones

Como se ha señalado uno de los métodos para estimar la media de una población es a través de

intervalos de confianza. Existen dos fórmulas para poder estimar la media de una población a

través de intervalos de confianza y el uso de cada una de ellas depende del caso que se examine.
6

El intervalo de confianza, para la media de una población, con un nivel de confianza de 1- α, siendo

X la media de una muestra de tamaño n y σ la desviación típica de la población, es:

   
 X  z , X  z 
 2 n 2 n 
El error máximo de estimación es:


E  z
2 n

 Cuanto mayor sea el tamaño de la muestra, n, menor es el error.

 Cuanto mayor sea el nivel de confianza, 1-α, mayor es el error.

Tamaño de la muestra:

2
 z 
n 2  
 E 
 
 
 Si aumentamos el nivel de confianza, aumenta el tamaño de la muestra.

 Si disminuimos el error, tenemos que aumentar el tamaño de la muestra.

Si se tienen dos poblaciones con medias 1 y  2 varianzas  12 y  22 , respectivamente, un

estimador puntual de la diferencia entre 1 y  2 está dado por la estadística x1  x2 . Por tanto.

Para obtener una estimación puntual de 1  2 , se seleccionan dos muestras aleatorias


7

independientes, una de cada población, de tamaño n1 y n2 , se calcula la diferencia x1  x2 de las

medias muestrales.

Recordando a la distribución muestral de diferencia de medias:

z
 x  x   m  m 
1 2 1 2

s12 s22

n1 n2

Al despejar de esta ecuación 1  2 , se obtiene lo siguiente:


m1  m2  x1  x2  z
s12 s22

n1 n2

En el caso en que se desconozcan las varianzas de la población y los tamaños de muestra sean

mayores a 30 se podrá utilizar la varianza de la muestra como una estimación puntual.

En una estimación de la proporción, sucede lo siguiente. Sea X una variable binomial de

parámetros n y p (una variable binomial es el número de éxitos en n ensayos; en cada ensayo la

probabilidad de éxito (p) es la misma, Si n es grande y p no está próximo a 0 o 1 ( np  5 ) X es

aproximadamente normal con media np y varianza npq (siendo q = 1 - p) y se puede usar el

estadístico:
8

X
p
n

pq
Que es también aproximadamente normal, con error típico dado por en consecuencia, un IC
n

para p al 100(1   )% será:

pq
p  z
2 n

Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se puede

establecer un intervalo de confianza para P al considerar la distribución muestral de proporciones.

pP
z
pq
n

pq
P  pz
n

Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el

procedimiento del intervalo de confianza que se establece aquí no es confiable, por tanto, no se

debe utilizar. Para estar seguro, se debe requerir que np ó nq sea mayor o igual a 5.

El error de estimación será la diferencia absoluta entre p y P, y podemos tener el nivel de confianza

pq
de que esta diferencia no excederá z
n
9

Para la estimación de diferencia de proporciones Para este caso en particular se utilizará la

distribución muestral de diferencia de proporciones para la estimación de las mismas. Recordando

la fórmula:

z
 p1  p2    P1  P2 
Pq Pq
1 1
 2 2
n1 n2

Y de aquí, se despeja P1  P2 :

Pq P2 q2
P1  P2   p1  p2   z 1 1

n1 n2

Aquí se tiene el mismo caso que en la estimación de una proporción, ya que al hacer el despeje

nos queda las dos proporciones poblacionales y es precisamente lo que queremos estimar.

4.3.- Determinación del tamaño de la muestra

MEDIA.- ¿Qué tan grande debe ser una muestra si la media muestral se va a usar para estimar la

media poblacional? La respuesta depende del error estándar de la media, si este fuera cero,

entonces se necesitaría una sola media que será igual necesariamente a la media poblacional

desconocida µ, porque σ = 0. El error máximo de estimación está dado por:

zs

n
10

Si se eleva al cuadrado ambos lados de esta ecuación y se despeja n de la ecuación resultante,

obtenemos:

2
 zs 
n 
 e 
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación

se convierte en:

zs N n

n N 1
z 2s2 N
n 2
e ( N  1)  z 2 s 2
PROPORCIÓN.- Se desea saber que tan grande se requiere que sea una muestra para asegurar que

el error al estimar P sea menor que una cantidad específica ε

pq
ez
n
z 2 pq
n 2
e
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación

se convierte en:
11

pq N  n
ez
n N 1
z 2 pqN
n 2
e ( N  1)  z 2 pq

DIFERENCIA DE MEDIAS.- la distribución muestral de diferencia de medias se tiene que error

está dado por:

s12 s22
e 
n1 n2

En esta ecuación se nos pueden presentar dos casos:

 Los tamaños de muestra son iguales.

 Los tamaños de muestra son diferentes

Para el primer caso, no hay ningún problema, se eleva al cuadrado y despejamos n

z 2 ( s12  s22 )
n
e2
Para el segundo caso, debemos poner una n en función de otra y que una población sea mayor

que otra y sepamos cuantas veces.

z 2 ( s12  ks22 )
n2 
ke2
12

DIFERENCIA DE PROPORCIONES.- la distribución muestral de diferencia de medias se tiene

que error está dado por:

p1q1 p2 q2
ez 
n1 n2

Y al igual que en la diferencia de medias, presentan los mismos casos. Por lo tanto las fórmulas

quedan de esta forma:

z 2 ( p1q1  p2 q2 )
n
CASO 1
e2

z 2 ( p1q1  kp2 q2 )
n2 
CASO 2
ke2
4.4.- Prueba de hipótesis

El propósito de la prueba de hipótesis es determinar si un valor propuesto (hipotético) para un parámetro

poblacional, por ejemplo para una media, debe aceptarse como plausible con base en la evidencia

muestral. El concepto de la prueba de hipótesis también se puede utilizar para probar hipótesis en relación

con datos cualitativos. Se han desarrollado tres métodos para pruebas de hipótesis, todos ellos

conducentes a la misma decisión cuando se usan los mismos estándares de probabilidad y de riesgo.

PRUEBA DE HIPÓTESIS DE PROPORCIÓN.- Las pruebas de grandes muestras de medias y

proporciones son bastante semejantes. De este modo, los valores estadísticos de prueba miden la

desviación de un valor estadístico de muestra a partir de un valor propuesto. Y ambas pruebas se


13

basan en la distribución normal estándar para valores críticos. Quizá la única diferencia real entre

las ambas radica en la forma corno se obtiene la desviación estándar de la distribución de muestreo.

Esta prueba comprende el cálculo del valor estadístico de prueba Z:

x
 p0
Z prueba  n
p0 (1  p0 )
n
Si se muestrea a partir de una población finita

n
100%  5%
N
Se debe utilizar el factor finito de corrección

x
 p0
Z prueba  n
p0 (1  p0 ) N  n
n N 1
El tipo de prueba refleja H1 . Por ejemplo, hay tres posibilidades para H1 :

H1 : p  p0
H1 : p  p0
H1 : p  p0
14

La hipótesis nula es:

H1 : p  p0

La primera alternativa establece una prueba de cola derecha; la segunda, izquierda y la tercera, una

prueba de dos colas.

PRUEBA DE HIPÓTESIS DE UNA MEDIA.- Si se conoce la desviación estándar de la

población (  ), la distribución de muestreo adecuada es la distribución normal. Si la población que

se muestra es normal, la distribución de muestreo será normal en el caso de todos los tamaños de

la muestra y el valor estadístico de prueba a utilizar es:

x
Z prueba 

n
Si la población no es normal, o si se desconoce su forma, se emplea la ecuación anterior

solamente para tamaños de muestra iguales o mayores 30, es decir, para n  30

Si no se conoce la desviación estándar de la población (  ), el valor estadístico de prueba es:

x
t prueba 
S
n
En este caso se debe usar el factor finito de corrección para modificar las desviaciones estándar,

por lo tanto se aplican las siguientes ecuaciones para  conocida y desconocida:


15

x x
Z prueba  t prueba 
 N n S N n
n N 1 n N 1

4.5.- Muestras pequeñas

Para la media poblacional y sus muestras pequeñas, cuando el número de observaciones es menor

a 30, la estimación del intervalo se basa en las suposiciones que si la población es normal o que si

se conoce la desviación estándar de la población.

En caso que la muestra sea pequeña, menor de 30, y se conozca la varianza de la población  2 , el

intervalo de confianza es:

 
X  Z    X  Z
2 n 2 n

Cuando el tamaño de la muestra sea pequeño y no se conozca la varianza poblacional  2 , se

utiliza la desviación estándar de la muestra s y la distribución de probabilidad t.

Cuando no se conoce la varianza poblacional, se utiliza el intervalo de confianza, que es el

siguiente:

s s  s s 
X  t    X  t ; P  X  t    X  t   1 
2 n 2 n  2 n 2 n
16

Para la proporción proporcional, todo el análisis para la estimación de la proporción poblacional

para muestras grandes se aplica para determinar la proporción poblacional para muestras pequeñas.

p(1  p) p(1  p)  p(1  p) p(1  p) 


p t    pt ; Pp t    pt   1 
n n  n n 

En la prueba para una media poblacional con muestra pequeña y desviación estándar poblacional
desconocida se utiliza el valor estadístico t.

x
t
S
n
17

Conclusión / retroalimentación

Concluyendo con esta investigación, debo de decir que, como en anteriores investigaciones,

aprendí algo nuevo y que sé que esto me va a servir en un futuro. Tuve varias complicaciones a la

hora de estar buscando información acerca de este tema. Sin embargo, logré recaudar la mayor

parte de la información posible para lograr que este trabajo pueda ser comprendido de una manera

mejor.

Decidí proponer una retroalimentación sobre este trabajo y a la vez, una conclusión, aprovechando

que puedo desenvolverme un poco más en esta parte y además, contar mi experiencia realizando

esta pequeña investigación

Ahora, puedo concluir diciendo que este tema de la unidad cuatro es un poco extenso pero pudo

resumirse de gran forma, sin perder la coherencia a lo que se explica. Como vimos, existen muchas

formas de calcular las estimaciones de una media, de una proporción y de diferencias. Así como

existen tamaños de muestras que influirán en los resultados que nosotros calcularíamos sobre una

población. En sí, es un poco complejo explicar del todo la esencia de este tema, pero con la práctica

se puede lograr comprender y, con más tiempo, dominarlo.

Al ya estar entrando en la estadística, me doy cuenta de que esto puede servir mucho para mi

carrera, por ejemplo para el cálculo de materiales necesarios, el dinero que debe invertirse o la

cantidad de empleados y probabilidades que puedan existir en una obra.


18

Referencias

Bibliografía
Benitez Morales, A. (s.f.). Universidad Autónoma del Estado de Hidalgo. Obtenido de
http://cidecame.uaeh.edu.mx/lcc/mapa/PROYECTO/libro19/index.html

Fallas, J. (2012). Obtenido de http://www.ucipfg.com/Repositorio/MGAP/MGAP-05/BLOQUE-


ACADEMICO/Unidad-2/complementarias/prueba_hipotesis_2012.pdf

Instituto Tecnológico de Chihuahua. (s.f.). Obtenido de


http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/u0102.pdf

Lombardía Cortiña, M. J. (s.f.). (U. d. Coruña, Ed.) Obtenido de


eio.usc.es/eipc1/base/BASEMASTER/FORMULARIOS-
PHP/MATERIALESMASTER/Mat_41855_T3IC.pdf

Universidad de Jaén. (s.f.). Estimación Puntual y por Intevalos de Confianza. Obtenido de


http://www4.ujaen.es/~dmontoro/Metodos/Temas/Tema7.pdf

Vargas Barrera, R. (2008). Estadística II. Bogotá, Colombia: Escuela Superior de Administración Pública.
Obtenido de http://www.esap.edu.co/portal/wp-content/uploads/2017/10/6-Estadstica-ii.pdf

Potrebbero piacerti anche