Sei sulla pagina 1di 11

3.

DISTRIBUCIÓN T DE ESTUDENT

La Distribución t (de Student) surge del problema de estimar la media de una población
normalmente distribuida cuando se desconoce la desviación estándar poblacional y el tamaño de
la muestra es pequeño. En este caso ya no se puede utilizar la v.a Z y en su lugar debe utilizarse
otro estadístico denominado T o de Student.

En este estadístico resulta de gran utilidad cuando por situaciones prácticas no se puede usar
muestras grandes y se desconoce la desviación estándar poblacional. Sin embargo, es necesario
que la población sea normal.

Recordar que el TLC implica que se debe conocer la desviación estándar poblacional y que la
muestra sea grande ( n>=30).

 DEFINICIÓN 1

Sea Z una variable aleatoria normal estándar y sea χ 2 una variable aleatoria ji-cuadrada con v
grados de libertad, ambas independientes. Entonces la distribución

Z
T=
χ2
√ v
Sigue la distribución T de Student con v grados de libertad y la función de densidad de
probabilidad está dada por

v+1
f ( t ; v )=
Γ ( 2 ) 2 − v+1
t (
∗[ 1+ ]
2 )
,−∞<t <∞ ; v >0
v v
√ πv∗Γ ( )
2

 GRAFICA DE LA DISTRIBUCIÓN T DE ESTUDENT

La forma específica de la distribución T de Student depende del valor de v , el cual constituye el


parámetro de la distribución con la definición : v = n-1 “grados de libertad”.

Luego, hay infinitas distribuciones T de Student que difieren en los grados de libertad.
 PROPIEDADES

1. La distribución T de Student es simétrica respecto del origen.


2. Es acampanada y asintótica.
3. Presenta una mayor variación respecto a la distribución normal estándar.
4. A medida que aumenta los grados de libertad la dispersión de la curva T disminuye.
5. Mediante el teorema de los límites se logra demostrar que cuando v → ∞ la secuencia de
curvas T se aproxima a la curva normal estándar; es decir, t → z.
6. Es unimodal y alcanza su valor máximo en t=0
7. Respecto a su valor esperado y varianza, se puede demostrar que E(T) = 0 y
v
σ 2t = ; v >2
v−2

Las distribuciones t de Student fueron descubiertas por William S. Gosset (1876-1937) en 1908 cuando trabajaba para la compañía de
cervezas Guinness en Dublín (Irlanda). No pudo publicar sus descubrimientos usando su propio nombre porque Guinness había prohibido
a sus empleados que publicaran información confidencial. Gosset firmó sus publicaciones usando el nombre de "Student".

EJEMPLO 1

Para una distribución de probabilidad T(7) , halle la P ( T > 1.895 )

SOLUCIÓN

7+1
∞( 2 )
Γ
t (
∗[ 1+ ]
2 − 7+1
) ∞
6 t2
−4

P ( T > 1.895 )= ∫
7
√ π∗7∗Γ ( )
7
2
=¿ ∫
7
∗ 1+
7 [ ] =¿ 0.05 ¿ ¿
1.895
2
1.895
√ π∗7∗Γ
2 ()
Para facilitar el cálculo de probabilidades sin que implica el uso de la función de densidad de
probabilidad T de Student , se dispone de tablas que contienen algunos valores de esta
distribución para diferentes grados de libertad mediante la siguiente definición:

t ∝ es el valor de T tal que el área a la derecha es ∝ :P ( T ≥t ∝ ) =∝

TABLA DE LA DISTRIBUCIÓN T DE STUDENT


 DEFINICIÓN 2

Si x́ es la media de una muestra aleatoria de tamaño n tomada de una población normal con
media μ, y s es la desviación estándar de la muestra, la cual es una estimación de la desviación
estándar de la poblacional σ , y t es el valor de la variable aleatoria que sigue la distribución T de
Student y grados de libertad v= n-1 , entonces

x́−μ
t (v ,∝ )=
s
√n
La anterior expresión se obtiene de :

X́−μ
∗σ
X́ −μ σ
Z σ n x́−μ
T= = = √ =
2 S s
χ ( n−1 )∗s2

v

EJEMPLO 2
√ σ2
(n−1)
√n

Los valores de las matrículas de estudiantes en una universidad privada tienen un comportamiento
aproximadamente normal, donde el promedio es de 2.100.000. Se seleccionan 8 liquidaciones,
siendo los valores los siguientes: 1.950.000, 2.100.000, 2.250.000, 1.890.000, 2.250.000,
1.950.000, 2.050.000, 2.350.000. Determine la probabilidad de que:

a. el promedio sea menor de 2.000.000.


b. el promedio se encuentre entre 2.000.000 y 2.200.000

SOLUCIÓN
Población: todos los valores de las matriculas de estudiantes de la universidad
Variable : X = pago de la matrícula
n= 8
Estadígrafos
Media muestral = x́ = $ 2.098.750
Desviación estándar muestral = s = $ 168.644,8
V= 8-1 = 7
a.
2000000−2100000
=¿
T= 168644.8 -1.677
√8
P ( X́ < 2000000¿=P ( t←1.677 ) =¿0,0687 RTA.

2000000−2100000 2200000−2100000
<t< ¿
b. P(2000000¿ X́ <2200000 ¿= P ( 168644.8 168644.8
√8 √8
P( -1.677 < t < 1.677) = P( t < 1.677 ) – P ( t < -1.677) = 0,9313- 0.0687 = 0.8626 RTA

EJEMPLO 3

Un fabricante de focos afirma que su producto durará un promedio de 500 horas de trabajo. Para
conservar este promedio, el fabricante verifica en 25 focos cada mes. Si el valor t calculado cae
entre -t(0.05) y t(0.05) (confianza de 90%) , el se encuentra satisfecho con esta información. ¿Qué
conclusión deberá sacar el fabricante si la muestra de 25 focos arrojó una media x́=518 horas y
una desviación estándar s = 40 horas? Asuma que la distribución de los tiempos de vida de los
focos es aproximadamente normal.

SOLUCIÓN

Población: todos los focos fabricados en el mes

Variable : X= tiempo de vida en horas de los focos

n= 25

Estadígrafos

x́=518
S = 40

518−500
=2.25
T= 40
√ 25
0.90

0.05 0.05
-t (0.05) = -1.7108 t(0.05) = 1.7108 tP = 2.25

Interpretación: El fabricante se debe sentir más que satisfecho, porque la muestra evidencia que
el promedio es mayor a 500 horas

4. DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN p

Se suelen presentar situaciones en las que no estamos interesados en la media muestral,


sino que queremos investigar, por Ej. , la proporción de artículos defectuosos en la
muestra, el porcentaje de estudiantes que usan Transmilenio como medio de trasporte en
la muestra , la proporción de hogares con TV plasma 8K en la muestra, etc. Para estos
casos la distribución muestral de proporciones resulta de gran utilidad para dar respuesta
a estas inquietudes que se han planteado.

La distribución muestral de la proporción se genera de forma similar que la distribución


muestral de medias, con la diferencia de que al usar muestras de tamaño n de la
población no se calcula el estadístico de la media , sino el estadístico conocido como
x
proporción muestral. (p = , siendo x número de casos favorables , y n es el tamaño de la
n
muestra)

 DEFINICIÓN
La distribución muestral de proporciones es la distribución de probabilidad de todas las
proporciones muestrales posibles que se pueden conformar de un determinado tamaño
de muestra n de alguna población con proporción poblacional P conocida.
Sea la v.a.d X b ( x ; n , p ) .
La proporción muestral p resulta de establecer una razón entre el número de éxitos u
observaciones de interés x y el tamaño de muestra n. Luego el estadístico proporción
muestral se define como:
x
p=
n
Estadístico → fórmula
Estadística → resultado o valor

 GRAFICA DE LA DISTRIBUCIÓN MUESTRAL DE PROPORCIONES.

POBLACIÓN DISTRIBUCIÓN MUESTRAL


N DE PROPORCIONES

 PROPIEDADES

1. VALOR ESPERADO O PROMEDIO


Si se selecciona una muestra aleatoria de n observaciones de una población binomial , con
un parámetro P , la media o valor esperado de p de la distribución muestral de
proporciones, es igual a la proporción poblacional P.
E [ p ] =P

2. VARIACIÓN O DISPERSIÓN

La desviación estándar o el error estándar σ p de la distribución muestral de la proporción


corresponde a la expresión:

P(1−P)
 σ p=
√n
P(1−P)
→ si la población es infinita o se desconoce su tamaño

N−n
 σ p=
√n

N−1
(tamaño poblacional)

→ si la población es finita ; es decir, se conoce N

N −n
El coeficiente
√ N −1
se conoce como factor de corrección para poblacional finita (fcpf)

3. FORMA DE LA DISTRIBUCIÓN MUESTRAL DE p


La distribución muestral de la proporción se aproxima a la distribución de probabilidad
normal siempre que n∗p ≥5 y n(1− p) ≥5. De igual forma, por el teorema central de
límite al usar una muestra de tamaño n ≥ 30, la distribución muestral de la proporción
tiene la forma límite de la distribución normal . Por tanto,
p−P
Z= → N (0,1)
σp
Lo anterior se deriva de que la distribución muestral de p está estrechamente ligada a la
distribución binomial. Por tanto ,se debe tener en cuenta la aproximación de la binomial a
la normal cuando se utilizan muestras grandes ( n>=30)

Sintaxis : p n ( P ,σ p )

GRÁFICA DE LA DISTRIBUCIÓN MUESTRAL DE PROPORCIONES p

P
EJEMPLO 1. Se sabe que la verdadera proporción de los componentes defectuosos
fabricadas por una firma es de 2 %. Encuentre la probabilidad de que una muestra
aleatoria de tamaño 70 tenga:

a. Menos del 2.5% de los componentes defectuosos.


b. Más del 1% pero menos del 4 % de partes defectuosas.

SOLUCIÓN

 POBLACIÓN: todos los componentes de la fábrica


 TAMAÑO DE LA POBLACIÓN: se desconoce
 X v.a : componentes defectuosos
 PROPORCIÓN POBLACIONAL : 2% → parámetro
 TAMAÑO DE MUESTRA : 70
 FORMA DE LA POBLACIÓN : se desconoce
 FORMA DE LA DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN: por el teorema de
límite central ( n >= 30) es aproximadamente normal.

a. P ( p < 2.5% ) = P ( p < 0.025)

Método de estandarización→ uso de Z

p−P
Z=
σp

P = 0.02→ proporci ó n de componentes defectuosos en la población

P(1−P) 0.02∗(1−0.02)
σ p=
√ n
=
√ 70
=0.01673 →error estándar de la distribución muestral de propoción

SINTAXIS: p n(P=0.02, σ p=0.01673)


p−P 0.025−0.02
Entonces, Z= = =0.298
σp 0.01673

P ( Z < 0.298) = 0.61715 → uso de la función en excel DISTR . NORM . ESTAND . N

P ( p < 0.025) = P ( Z < 0.298) = 0.6175 RTA.

Método usando la función en Excel DISTR . NORM . N

P ( p < 0.025)= 0.6175


→ al seleccionar una muestra de 70 componentes hay una probabilidad de 0.6175 que menos del 2.5 % salgan defe

Método usando la distribución normal online

b. P( 0.01 < p < 0.04 )=

P ( p < 0.04 ) = 0.88405

P ( p < 0.01 ) = 0.27501

Entonces, P( 0.01 < p < 0.04 )= 0.8845 – 0.27501 = 0.6094 RTA.


EJEMPLO 2.
El 80% de los hogares tienen suscripción a TV por cable. En una muestra de 300 hogares
¿qué tan posible es que la proporción en la muestra,
a. sea menor de 0.76?
b. se encuentre entre 0.70 y 0.74?
c. sea mayor de 0.82?

SOLUCIÓN

 POBLACIÓN: Todos los hogares de cierta región


 TAMAÑO DE LA POBLACIÓN: se desconoce
 X v.a : que tienen suscripción a TV por cable
 PROPORCIÓN POBLACIONAL : P = 0.80
 TAMAÑO DE MUESTRA : 300 hogares
 FORMA DE LA POBLACIÓN : se desconoce
 FORMA DE LA DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN: por el teorema de
límite central ( n >= 30) es aproximadamente normal.

P(1−P) 0.80∗(1−0.80)
 Error típico o error estándar σ p=
√ n
=
√ 300
→ variación de la distribución muestral de proporciones
=¿ 0.0230

 Sintaxis p n( P=0.80 , σ p=0.0230)

a. P ( p < 0.76) = 0.0410 RTA.


p

b. P ( 0.70< p < 0.74)

P (p < 0.74)= 0.004544

P(p < 0.70) = 0.000000687

P ( 0.70< p < 0.74) = 0.004544 – 0.000000687 = 0.004533 RTA.


p

d. P ( p > 0.82) = 1 – P (p < 0.82 ) = 1 - 0.807731 = 0.1922 RTA.

Potrebbero piacerti anche