Sei sulla pagina 1di 46

¡¡¡Bienvenidos al

maravilloso mundo
de la Estadística y
Probabilidad!!!
Distribuciones de probabilidad con variable
continua
Distribución de probabilidad exponencial.
La distribución exponencial describe procesos en los que nos
interesa saber el tiempo hasta que ocurre determinado evento.

1 1
x , x
P( X  x)  e 
P( X  x)  1  e 
Ejercicio.
Un experto en reparación de motores encuentra que
el tiempo que invierte en el trabajo tiene una media
de 30 minutos. Determinar la probabilidad de que la
reparación de un motor sea.
a) Se repare en 45 minutos.
b) El tiempo de reparación sea mayor a 1 hora y
quince minutos.
c) El tiempo de reparación sea menor a 20 minutos.
1
75
P ( X  75)  e 30
 0,08208

1
20
P( X  20)  1  e 30
 0,48658
Distribución de probabilidad Normal.
La distribución normal se conoce también como
distribución gaussiana, y es la distribución que
con más frecuencia aparece aproximada en
fenómenos reales, para valores de promedio y
desviación estándar.
Ve  
Z

Ejercicio.
Una empresa lleva a cabo una prueba para
seleccionar nuevos empleados. Por la experiencia de
pruebas anteriores, se sabe que las puntuaciones
siguen una distribución normal con una media 80
puntos y desviación típica o estándar de 25 puntos.
a) Qué porcentaje de candidatos obtendrá menos
de 75 puntos.
b) Qué porcentaje de candidatos obtendrá entre 65
y 90 puntos
a) 75  80
Z  0,2
25

P(z=-0,2)= 0,4207

El porcentaje de candidatos que obtendrán menos de 75


puntos es del 42,07%.
65  80 90  80
Z   0,6 Z  0,4
b) 25 25

Existe un 22,57% de candidatos que obtienen un puntaje entre


65 y 80 puntos, y existe un 15,54% de candidatos que obtienen
un puntaje entre 80 y 90 puntos.
Por lo tanto el porcentaje de candidatos que obtendrán entre 65
y 90 puntos es del 39,11%.

11
Distribución de probabilidad t-Student.
La distribución t-student nace de la necesidad de estimar dos medias
cuando no se tiene la desviación estándar de la población y ésta debe
ser estimada a partir de los datos de una muestra, donde el numero de
datos son menores o iguales 30.

x
t
 , con n-1 grado de libertad.
n
Ejercicio.
El ciclo medio de vida operativa de una muestra
aleatoria de 10 focos es de 4000 horas con la
desviación estándar de la muestra de 200 horas,
estimar el ciclo medio de vida operativa de la
población de focos aplicando un 95% de
confianza.
Para determinar el ciclo medio de vida operativa con el
95% de confianza utilizamos.

t * ( / n )    x
con 9 grados de libertad.

1,8331* (200 / 10 )  4000  4115,93


Por lo tanto el ciclo medio de vida operativa con el 95%
de confianza es de 4115,93 horas.
INFERENCIA ESTADISTICA
La inferencia estadística hace relación que a partir de
una muestra, se realizan conclusiones y se hacen
sugerencias y recomendaciones para una población.
ERROR ESTANDAR DE LA MEDIA
En la mayoría de situaciones practicas no podemos
proceder con el tamaño de la población, y tenemos la
media y desviación estándar de dicha población,
entonces hacemos una aproximación de la desviación
estándar de la población a la desviación estándar de
la muestra.
ERROR ESTANDAR DE LA MEDIA
x 

n
Ejemplo:
Que podemos decir de la desviación estándar de la
muestra, si tomamos una muestra de tamaño 64, para
una desviación estándar de la población es de 20.
 x  2,5
TEOREMA DEL LIMITE CENTRAL
Este teorema es de vital importancia en estadística por
que justifica el uso de la normal en una gran variedad
de problemas para la toma de decisiones.

Z 
x  

n
EJEMPLO:
Determinar la probabilidad de que el error sea menor
a 5 , cuando se usa una media aleatoria de tamaño n =
64, para estimar la media de una población infinita con
desviación estándar igual a 20.
Para calcular la probabilidad calculamos primero.
x   5
Z  Z  2
 20
n 64

Buscamos en la tabla ese valor y corresponde a


95,4% Aproximadamente.
ERROR MAXIMO DE LA ESTIMACION

El error máximo de la estimación nos permite


calcular la probabilidad de que la media de una
muestra aleatoria difiera de la media de la población
lo sumo por.
Para muestra grandes

E  Z
2 n

Para muestra pequeñas, menores a 30



E  t
n
Para una confiabilidad de un 90%
  0,05
Y Z 0 , 05  1,645,
2

para confiabilidad del 95%


y ,
  0,025 Z 0 , 025  1,96
2

y para una Confiabilidad del 99%


  0,005 y Z 0, 005  2,575
2
Ejemplo.
Un equipo de expertos en eficiencia pretende usar la
media de una muestra aleatoria de tamaño 150, para
estimar la actitud de los trabajadores. Si con base en
la experiencia los expertos considera una desviación
estándar 6,2 para tales datos. Que se puede afirmar
con una confiabilidad 99% sobre el error máximo de
la estimación?.
Como el error máximo esta dado por.


E  Z
2 n al reemplazar nos queda

6,2
E  2,575  1,30
150
TAMAÑO DE LA MUESTRA
Para estimar el tamaño de la muestra necesaria
con una confiabilidad o grado de precisión usamos
la formula del error.

 Z 
2

n 2



E 

Ejemplo:
El decano de la facultad de Administración desea
usar la media para estimar el tiempo promedio que
un estudiante requiere para dar una respuesta, y
quiere afirmar con una confiabilidad del 95% que
su error a lo sumo es de 0,25 minutos. Que tan
grande será la muestra si la desviación estándar es
de 1,5 minutos.
El tamaño de la muestra esta dado por.
 Z 
2

n   2
 , entonces


E 

2
1,96 *1,5 
n   138,26  139
 0, 25 
INTERVALO DE CONFIANZA
El intervalo de confianza nos dan puntos terminales
para una confiabilidad, y tiene la ventaja que cubre
todos los valores por su tamaño y el grado de
confianza.

X E   X E
Ejemplo:
1. Si se sabe que un trabajador se demora un tiempo
promedio de 19,9 minutos en ensamblar un juguete con
una desviación estándar de 5,73.
Entre que tiempo lo ensamblaría si se toma una muestra
de 36 trabajadores y se quiere una confiabilidad del
95%.
Solución:
Como el intervalo es: X  E    X  E donde,
minutos y X  19,9
5,73
E  1,96  1,8718 por lo tanto,
36
19,9  1,9    19,9,  1,9 18    21,8

Se tiene la confiabilidad de duración entre 18 y 21,8 minutos


2. Para probar la durabilidad de una pintura nueva para
líneas divisorias, un departamento de carreteras pinto
franjas de pruebas en 8 sitios diferentes y los contadores
electrónicos demostraron que la pintura se deterioro luego
que 142600, 167800, 136500, 108300, 126400, 133700,
162000, y 149400 Automóviles cruzaron.
Elabore un intervalo de confianza del 95% la cantidad
promedio de transito que esta pintura puede soportar.
Como hablamos de unos datos de la población, calculamos
X (X-M)^2
142600 3106406,25
167800 726976406
136500 18813906,3
108300 1058688906
126400 208441406
133700 50943906,3
162000 447851406
149400 73316406,3
Sumatoria 1126700 2588138750

Media 140837,5
Varianza 323517344
Desviacion 17986,5879
Luego calculamos el Error máximo.
E= 1,895*17986,56 = 34084,53
Y el intervalo de confianza seria.

140837,5  34084,53    140837,5  34084,53


106752,96    174922,03
Esta pintura puede soportar entre 106752,96 y 174922,03
cruces de automóviles.
PRUEBAS DE HIPOTESIS
Una hipótesis estadística es una afirmación sobre un parámetro
de una población, por lo general se realiza con respecto a
promedios o medias,
Se acepta Ho Se rechaza Ho
H o es verdadera Decisión correcta Error tipo I

H o es falsa Error tipo II Decisión correcta


1. Se afirma que un automóvil se conduce en promedio
más de 20.000 kilómetros por año. Para probar esta
afirmación, se pide a una muestra de 100 propietarios de
automóviles que lleven un registro de los kilómetros que
viajen .¿Está de acuerdo con esta afirmación si en la
muestra aleatoria se obtuvo un promedio de 23.500 km y
una desviación estándar de la población es de 3900 km ,
Utilice un nivel de significancia de 99%.
Hipótesis nula Ho = 20.000 Kms.
Hipótesis Alternativa. Ha < o > 20.000 Kms.
Error máximo E  2,575
3900
 1004,25
100
Intervalo de confianza.
23500  1004    23500  1004
22496    24504
No se acepta la hipótesis nula, ya que queda por fuera del
intervalo de confianza.
2. Un investigador esta convencido de que su
instrumento de medición tenia una variabilidad medida
por una promedio igual a 4 decibeles. Durante un
experimento, el registra las medidas 4.1, 5.2, 10.2.
¿Estos datos confirman o rechazan su afirmación?.
Utilice una confiabilidad del 90%
Hipótesis nula, Ho = 4 Decibeles.
Hipótesis Alternativa, Ha > o < 4 Decibeles.
 , E  1,886 * 2,65 
E  t 
2,8855
n 3

Intervalo de confianza.
3,614    9,385
X
4,1
5,2
10,2

Promedio 6,5
Se acepta la hipótesis nula.
Desviacion 2,65456
REGRESION LINEAL
La regresión lineal la utilizamos para realizar ajustes lineales y
pronosticar cuando se tiene información con doble variable,
puntos (x,y).
෍ 𝑦 = 𝑛𝑎 + 𝑏(෍ 𝑥)

෍ 𝑥𝑦 = 𝑎 ෍ 𝑥 + 𝑏(෍ 𝑥 2 )
Ejemplo:
Los siguientes datos de una muestra representan la
demanda de un producto ( en miles de unidades) y su
precio (en miles de pesos) cobrados en 6 áreas distintas de
mercados:
Precio (x) 18, 10, 14, 11, 16, 13
Demanda (y) 98, 72, 77, 60, 92, 79
Pronosticar la demanda del producto en función del precio,
que demanda se tendría para un precio 17, y si la demanda
es de 80 cual es el precio esperado.
La ecuación de regresión lineal es de la forma
Y = b X + a, a partir de la siguiente tabla planteamos el
sistema visto.
478 = 6 a +82 b
X Y X^2 XY
18
10
98
72
324
100
1764
720
6721 = 82 a + 1166 b
14
11
77
60
196
121
1078
660
solucionando el sistema nos da
16 92 256 1472
13 79 169 1027 que b = 4,15 y a = 22.89 por lo tanto
82 478 1166 6721 la ecuación lineal Y=4,15X+22,89 es
la que pronostica la demanda en función del precio.
La demanda esperada para un precio de 17 es.
Y = 4,15 * 17 + 22,89 = 93,44 miles de unidades.

El precio para una demanda de 80 unidades es de.


80 = 4,15 X + 22.89 ; X = 13,76 unidades de mil.

Potrebbero piacerti anche