Sei sulla pagina 1di 24

Luis Armando Rosas Rivera

TEOREMA DEL LIMITE CENTRAL


Probabilidad y Estadística
UMSA
1

Teorema del Límite Central Luis Armando Rosas Rivera

• ¿Qué sucede si la distribución de los datos no


es Normal.

Cuando la distribución de las desviaciones no es


normal, el uso de la aproximación mediante las
distribuciones estadísticas normales suele no ser la
indicada.

El hecho es que al experimentador siempre obtendrá


una respuesta basada en métodos estadísticos a sus 2
necesidades de información.

1
Teorema del Límite Central

Luis Armando Rosas Rivera


• Centremos nuestro interés en los promedios. Estos, sin
duda, mostrarán una Distribución Normal de las
diferencias con respectos al promedio de todos los
promedios.

• Esta conclusión práctica fue cristalizada en un teorema


matemático que ha sido una herramienta poderosísima
para el análisis científico de las poblaciones, El Teorema
central del Límite. Que dice:
3

Teorema del Límite Central Luis Armando Rosas Rivera

• Sea X una variable aleatoria con cualquier


distribución, con media  y varianza 2. La función
de distribución de la media muestral es
aproximadamente normal con media  y

desviación estándar: ̅

Esto es válido, cuando el tamaño de la muestra (n) es


grande. 4

2
Teorema del Límite Central

Luis Armando Rosas Rivera


• Lo trascendente del Teorema Central del Límite,
es que asegura que independientemente de cuál
sea la distribución de las diferencias de los datos,
las diferencias de los promedios:

SE DISTRIBUIRÁ COMO UNA NORMAL ESTÁNDAR.

• Aplicable a las Técnicas de Muestreo, El Análisis


de Experimentos, Los Métodos Cuantitativos, Las
Técnicas de Simulación y Emulación. Una
importante proporción de sistemas y métodos de 5
análisis de resultados en diferentes ciencias.

TEOREMA DEL LIMITE CENTRAL Luis Armando Rosas Rivera

“Si se toman sucesivas muestras (k) de tamaño n de una


población que puede o no ser normal, la distribución de
probabilidad de esas muestras, conforme n se vuelve
grande, se aproxima a una distribución normal con:

x  x  

x  

x
n
x
Z 
 6
x   x

3
TEOREMA DEL LIMITE CENTRAL

Luis Armando Rosas Rivera


n1
N
n2 x1 x 2 x3 x 4 ........ xk
n3
x
x k :# de muestras
n4 k

nm  x2  
x  x2

k 7

Es fundamental para la utilización de las ventajas que


ofrece él Teorema Central del Límite, interpretar Luis Armando Rosas Rivera
correctamente el Desvío Típico o Desvío Estándar de los
promedios que está definido por:

S Para poblaciones grandes que es los


S  apropiados para la Distribución Normal
n Estándar.
s 1
Para poblaciones pequeñas debe sx  1
usarse: n N

El agregado a la primera fórmula se conoce como fracción


muestral, que se aproxima a 1 cuando N es grande. El
término grande es muy relativo, usualmente 30, para el
curso se considerará una población como “grande”
cuando tenga más de 120 elementos. La razón se debe al 8
uso de la Distribución “t”, adecuada a muestras pequeñas
que se explicará más adelante.

4
Distribución de la media muestral

Luis Armando Rosas Rivera


0.95

  
 2 2
n x1 x3 x4 x2 n
9

Aplicación del Teorema del Límite Central


Luis Armando Rosas Rivera

Para ilustrar este procedimiento construiremos la función de


distribución de la media muestral de una pequeña población
conformada por el número de huevos de 5 tortugas Laud que
desovaron en cierta playa.
El número de huevos por tortuga fue de 68 70 72 74 y 76
El número de muestras posibles de tamaño 2 con sustitución
es de 25

(68,68), (68,70), (68,72), (68,74), (68,76),


(70,68), (70,70), (70,72), (70,74), (70,76),
(72,68), (72,70), (72,72), (72,74), (72,76), 10
(74,68), (74,70), (74,72), (74,74), (74,76),
(76,68), (76,70), (76,72), (76,74), (76,76)

5
Cuales son los valores que podríamos esperar

Luis Armando Rosas Rivera


encontrar ya que el número de huevos que produce
cada tortuga es una variable continua…

x 68 70 72 74 76 ~
x f f
68 68 69 70 71 72 68 1 0.04
70 69 70 71 72 73 69 2 0.08
72 70 71 72 73 74 70 3 0.12
74 71 4 0.16
71 72 73 74 75
72 5 0.20
76 72 73 74 75 76 73 4 0.16
74 3 0.12
Construyendo su distribución
75 2 0.08 11
de frecuencias tendríamos: 76 1 0.04

Aplicación del Teorema del


Límite Central Luis Armando Rosas Rivera

Que se representa por esta figura o


histograma
0.2

0.16

0.12

0.08

0.04

0
12
68 69 70 71 72 73 74 75 76

6
Aplicación del Teorema del
Límite Central

Luis Armando Rosas Rivera


La media de la población es:
68  70  72  74  76 360

  72
5 5

La varianza de la población es:

2 
68  722  70  722  72  722  74  722  76  722 
5
16  4  0  4  16 40
 8
5 5 13

Aplicación del Teorema del Límite Central


Luis Armando Rosas Rivera

Calculando ahora la media de todas las medias:


68 (1)  69 ( 2 )  70 (3)  71( 4 )  72 (5)  73 ( 4 )  74 (3)  75 ( 2 )  76 (1)
x  
25

68  138  210  284  360  292  222  150  76 1800 


 72
25 25

Por lo tanto
x  
Recordemos esto se debe 14
al teorema del límite
central…

7
Aplicación del Teorema del Límite Central

Luis Armando Rosas Rivera


Calculando ahora la varianza de la media muestral
 x2 
68  722 (1)  69  722 2  70  722 3  71 722 (4)  72  722 (5) 
25

73  722 (4)  74  722 (3)  75  722 2  76  722 1 
25

16  18  12  4  0  4  12  18  16 100
 4
25 25

2
Por lo tanto   2
x
Recordemos esto se debe 15
n al teorema del límite
central…

Los resultados anteriores se obtuvieron suponiendo que el


muestreo es con reemplazo o que las muestras se han extraído de
Luis Armando Rosas Rivera
una población finita.

En general no se muestrea con reemplazo, y en muchas


ocasiones se muestrea a partir de poblaciones infinitas.

En el ejemplo, bajo un muestreo sin reemplazo, el número de


muestras posibles es 10 (las que están por encima de la diagonal
en la tabla).
x 68 70 72 74 76
68 68 69 70 71 72
68 70 72 74 y 76 70 69 70 71 72 73
72 70 71 72 73 74
16
74 71 72 73 74 75
76 72 73 74 75 76

8
El número de muestras de tamaño n en una población de tamaño

Luis Armando Rosas Rivera


N está dado por la combinación N N!
  
 n  n!( N  n)!
En el ejemplo:  5  5!
    10
 2  2!3!

(68,70), (68,72), (68,74), (68,76), (70,72),


(70,74), (70,76), (72,74), (72,76), (74,76).

Con medias 69, 70, 71, 72, 71, 72, 73, 73, 74, y 75,
respectivamente y la media de estas
69(1)  70(1)  71(2)  72(2)  73(2)  74(1)  75(1)
x  
10 17
69  70  142  144  146  74  75 720
 10  72
10

Aplicación del Teorema del Límite Central


y la varianza de la media muestral: Luis Armando Rosas Rivera

 x2 
69  722 1  70  722 (1)  71  722 (2)  72  722 (2)  73  722 2 
10

74  722 (1)  75  722 (1)  9420249



30
3
10 10 10

En este caso la varianza de la media muestral no es igual a la


varianza poblacional entre el tamaño de la muestra.
Sin embargo, existe una relación entre estas y está dada por:

2 N n
 2
 18
N 1
x
n

9
Aplicación del Teorema del Límite Central

Luis Armando Rosas Rivera


En el ejemplo:
2 N n 8 52 3
    4  3   x2
n N 1 2 5 1 4
N n Se conoce como factor de corrección por población finita
N 1

Este factor puede ignorarse cuando el tamaño de la muestra


es pequeño en comparación con el tamaño de la población.
Como sugerencia, el factor de corrección por población
finita se usa si la muestra contiene mas del 5% de las
observaciones de la población, esto es, si :
n
 0.05 19
N

Aplicación del Teorema del Límite Central


Luis Armando Rosas Rivera

Distrib. de x Distrib. de

Media  

Varianza 

Desv. Standard 

Mas cerca de 20
Forma de la curva Cualquiera la Normal

10
EJEMPLO

Luis Armando Rosas Rivera


• El valor nominal de la resistencia de una lámina
de un metal compuesto es de 8500 psi. Por
estudios pasados se conoce que la desviación
estándar de esta resistencia es 1950 psi. Se
tiene una muestra de 100 láminas. ¿Cuál es la
probabilidad de que la media de esa muestra:
a. Sea mayor a 8900 psi?
b. Sea menor a 8000 psi?
c. Esté entre 8200 y 8700 psi?
d. ¿Que valor de la media tiene una probabilidad de
ocurrencia menor a 16.35%?

21

SOLUCION Luis Armando Rosas Rivera

Solución: =8500 =1950 n=100


a. Media mayor que 8900

P ( x  8900)  1  P( x  8900)
 8900  8500 
P ( x  8900)  1  N    1  N (2.05)
 1950 / 100 
P ( x  8900)  1  0.9798  0.0202
22

11
SOLUCION

Luis Armando Rosas Rivera


b. Media menor que 8000

 8000  8500 
P ( x  8000)  N    N (2.56)  0.0053
 1950 / 100 

c. Media entre 8200 y 8700


 8700  8500   8200  8500 
P(8200  x  8700)  N    N 
 1950 / 100   1950 / 100 
P(8200  x  8700)  N (1.03)  N (1.54)  0.8485  0.0618  0.7867
23

SOLUCION Luis Armando Rosas Rivera

d. Xbarra para P(xbarra=XBar)=0.16

P( x  xi )  0.16 Z 0.1635  0.98


xi  8500
 0.98 
1950 / 100
xi  195 * (0.98)  8500  8308.9
24

12
PROPORCIONES MUESTRALES

Luis Armando Rosas Rivera


n1 xi
N pi 
n2
ni
n3
p1 p2 p3 p4 ........ pk

n4 p
p k :# de muestras
k
p 
nk Z
p 25

DISTRIBUCION DE LAS
PROPORCIONES MUESTRALES Luis Armando Rosas Rivera

 Error estándar de la distribución muestral de


proporciones es:
 * (1   )
p 
n
p * (1  p )
sp 
n
 Factor de corrección para poblaciones finitas

 * (1   ) N  n p * (1  p ) N  n
  sp 
n N 1 n N 1
26

13
EJEMPLO

Luis Armando Rosas Rivera


Si se afirma que lotes de productos son
8% defectuosos. Al inspeccionar un lote
de producto sobre la base de una muestra
de 1098 unidades se encuentran 102 que
no reúnen los requisitos planteados. ¿Qué
probabilidad de ocurrencia tiene un
porcentaje igual o menor al encontrado en
esta muestra?
27

SOLUCION Luis Armando Rosas Rivera

=0.08
p= 102/1098= 0.0929
Probabilidad pedida?

0.0929  0.08 0.0929  0.08


Z   1.47
p 0.00875
0.0929(1  0.0929)
p   0.00875
1098
N (1.47)  0.9292
28

14
Luis Armando Rosas Rivera
Distribuciones
usadas en inferencia
29

Distribución “t” de Student Luis Armando Rosas Rivera

• Definiendo el estadístico t:

x -
t=
s/ n
• Se puede probar que siendo x el promedio
de una muestra tomada de una población
normal con media  y varianza 2, el
estadístico t es el valor de una variable
aleatoria con distribución "t" de Student y
parámetro  (grados de libertad) = n-1. 30

15
Ji‐cuadrado

Luis Armando Rosas Rivera


• Distribución Ji-cuadrado es una función de
densidad de probabilidad que representa la
distribución muestral de la varianza.

• Definimos la función de densidad como:

n y
1 
2 2
y e
fY ( y )  , x0
n
n
2  
2
31
2

Ji‐cuadrado
Luis Armando Rosas Rivera

• Nunca adopta valores menores de 0


• Es asimétrica positiva
• Es una familia de curvas, en función de los
llamados “grados de libertad”. Es decir, hay una
distribución chi-cuadrado con 1 gl, una
distribución chi-cuadrado con 2 gl, etc.
• A medida que aumentan los grados de libertad,
la distribución se hace más y más simétrica.
• Empleo: En pruebas de bondad de ajuste (para
comparar las puntuaciones predichas con las 32
observadas), entre otras.

16
Ji‐cuadrado

Ji‐cuadrado
Luis Armando Rosas Rivera Luis Armando Rosas Rivera

34
33

17
Caracteristicas Ji‐cuadrado

Luis Armando Rosas Rivera


• Asimétrica y asintótica al eje x por la derecha;
• Su dominio va de 0 a +
• Area bajo la curva desde 0 a + =1
• Tiene parámetro  = n-1 (g.d.l.)
• Al aumentar n se aproxima a la normal
• Representa distribución muestreal de varianza.
• Entre las aplicaciones:
• Determinación intervalos confianza para varianzas
• Pruebas de hipótesis para una varianza
• Tablas de contingencia
• El ajuste de datos a una distribución dada conocida 35
• Las pruebas de independencia.

Distribución Muestral de S2
Luis Armando Rosas Rivera

Si S2 es la varianza de una muestra


aleatoria de tamaño n que se toma de
una población normal que tiene la
varianza entonces el estadístico:
(n  1) S 2 n
 X i  X 2
 
2
 2
 
i 1 2
tiene una distribución ji cuadrada con
n -1 grados de libertad. 36

18
Distribución Muestral de
(n  1) s*2

Luis Armando Rosas Rivera


2
Probability Density Function
y=chi2(x,10)
0.175

0.131

0.087

0.044

37
0.000
0.00 6.25 12.50 18.75 25.00

Distribución Muestral de
Si X se distribuye como N (  ,  ) Luis Armando Rosas Rivera

Tipificando xx
 se distribuye como N (0,1)

n  x  x
2
se distribuye como 12
X   n2 
2

2
i
i 1

1 n n
s  2
 x  x    x  x 2  (n  1)s*2
2
n  1 i 1
*
i 1

(n  1) s*2
se distribuye como  n21 38

2

19
TABLA DE 2

Luis Armando Rosas Rivera


orden percentílico

n 0.99 0.975 0.025 0.01


p
1
2
3
4 2n
5

grados de libertad
valores acumulados de 2n 39

Tabla Distribución 2
• Valores 2 para varios
,
• Area a su derecha = .
• 1ª columna = 
• 1ª fila: áreas en la cola
a la derecha de 2
• Cuerpo tabla son los
valores de 2

Luis Armando Rosas


Rivera 40

20
Usos de la Ji-Cuadrado

Luis Armando Rosas Rivera


a) Para hacer inferencias acerca de la varianza
poblacional. Es decir, para calcular Intervalos de
Confianza y Prueba de hipótesis para la varianza
poblacional.
b) Para hacer pruebas de Bondad de Ajuste. O sea,
para probar si un conjunto de datos sigue una
distribución pre-determinada.
c) Para hacer análisis de tablas de contingencia.
41

Distribución "F” de Fisher


Luis Armando Rosas Rivera

• También llamada "F” de Fisher - Schnedecor


• Representa la distribución muestral de la razón
de dos varianzas. Es decir que se obtiene de la
razón de dos distribuciones Ji-cuadrado.
• Definimos el estadístico F como:
2
F = s2 1
s2
• El cual es el valor de una variable aleatoria que
tiene distribución F con parámetros 1=n1-1 y 42
2=n2-1.

21
Distribución "F” de Fisher

Luis Armando Rosas Rivera


43

Distribución "F” de Fisher Luis Armando Rosas Rivera

44

22
Propiedades de Distribución F

Luis Armando Rosas Rivera


• Asimétrica, y asintótica al eje x por el lado
derecho
• Su dominio va de 0 a +
• Área bajo curva desde 0 a + =1
• Tiene parámetros 1=n1-1 y 2=n2-1.
• Entre sus aplicaciones:
• Pruebas de hipótesis entre 2 varianzas
• Análisis de varianza
• Análisis de covarianza.
45

Tabla de Distribución F
• Tablas independientes de
valores de F para =0.01
y =0.05 para varias
combinaciones de 1 y
2.
• Se escoge la tabla para la
probabilidad deseada y
se escoge 1 en la fila
superior y 2 en la 1ª
columna. La intersección
nos da el valor de F
deseado.

Luis Armando Rosas


Rivera 46

23
Luis Armando Rosas Rivera
Muchas Gracias
Estoy listo
para la
prueba

47

24

Potrebbero piacerti anche