Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Federico Villarreal
GUÍA ACADÉMICA
ESTADISTICA
ADMINISTRACIÓN IV CICLO
Euded
Escuela Universitaria
Educación a distancia
INDICE
PRESENTACIÓN 04
INTRODUCCIÓN A LA ASIGNATURA 05
ORIENTACIONES GENERALES DE ESTUDIO 06
TUTORÍAS 07
CRONOGRAMA 07
EVALUACIÓN 08
MEDIOS Y RECURSOS DIDÁCTICOS 09
OBJETIVOS GENERALES 10
ACTIVIDADES 27
AUTOEVALUACIÓN N°1 29
ACTIVIDADES 41
AUTOEVALUACIÓN N°2 43
UNIDAD 3: ANALISIS DE CORRELACION Y REGRESION E INTRODUCCIÓN A LAS 44
PROBABILIDADES
ACTIVIDADES 62
AUTOEVALUACIÓN N°3 64
ACTIVIDADES 82
AUTOEVALUACIÓN 4 84
SOLUCIONARIO DE AUTOEVALUACIONES 85
ANEXOS 89
PRESENTACIÓN
INTRODUCCIÓN A LA ASIGNATURA
En nuestros días, la estadística se ha convertido en método efectivo para describir con exactitud
los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve
como herramienta para relacionar y analizar dichos datos. El objetivo que se persigue es ya no
sólo reunir y tabular los datos, sino sobre todo conocer el proceso de interpretación de esa
información
Estimados participantes:
La razón de ser de los cursos virtuales es facilitar el acceso a los programas educativos de
aquellos estudiantes cuyos horarios o situación geográfica no son compatibles con la formación
presencial, sin embargo, su objetivo es muy claro: ofrecer una calidad académica igual o superior
a la que se brinda en los programas presenciales. Por ello, los programas virtuales se apoyan en
la más moderna tecnología informática y de comunicaciones (aulas virtuales) que permiten un
alto grado de interacción y orientación del profesor y una elevada interrelación entre los
estudiantes.
Leer, estudiar y trabajar el material didáctico diariamente. Es preferible una hora diaria
durante siete días consecutivos, que 10 horas en un solo día. Las claves del éxito son
continuidad y constancia.
Organizar el tiempo de estudio según las propias condiciones, dificultades y necesidades de
trabajo; en caso contrario el plan de estudios no se cumplirá.
Leer varias veces el material y después comenzar con el resaltado de las ideas principales
para organizar el material de estudio (resúmenes, cuadros sinópticos, etc.
Trabajar el material en el mismo orden en que se entrega. No olvide de realizar las actividades
que tiene en su Texto como en su Guía Académica.
Estudiar en un lugar donde se sienta cómodo para realizar las lecturas y hacer sus tareas.
En lo posible un lugar con claridad y libre de ruido.
TUTORÍAS
TUTORÍAS
Las tutorías serán desarrolladas mediante la programación de un calendario de tutorías. Éstas
serán presenciales y virtuales.
CRONOGRAMA
Cantidad de horas académicas
Tutorías presenciales y virtuales Horas de video
Horas presenciales Horas virtuales conferencia
Semana 1 2 2.5 3
UNIDAD I
Semana 2 2 2.5 3
Semana 3 2 2.5 3
UNIDAD II
Semana 4 2 2.5 3
Evaluación parcial virtual Unidades I – II
Semana 5 2 2.5 3
UNIDAD III
Semana 6 2 2.5 3
Semana 7 2 2.5 3
UNIDAD IV
Semana 8 2 2.5 3
Evaluación final Unidades III – IV
16 20 24
TOTAL
60 horas académicas
EVALUACIÓN
El promedio final de la asignatura en la Modalidad Presencial – Virtual se obtiene aplicando los
siguientes pasos porcentuales:
El estudiante que abandona la asignatura tendrá promedio 00 (cero) en el acta final, debiendo
registrar nuevamente su matrícula.
MEDIOS Y RECURSOS DIDÁCTICOS
Referencias electrónicas
http://estadisticaparaadministracion.blogspot.com/
http://www.dm.uba.ar/materias/estadistica_Q/2011/1/modulo%
20descriptiva.pdf
http://www.fuenterrebollo.com/Economicas2013/unidime
nsional-ejercicios.pdf
Referencias electrónicas:
http://www.youtube.com/watch?v=lpUkW6xxWog&feature=shar
e&list=PLqEro_vpDCG5DJsnzJDiYQ-0jhGsYcVYA
http://youtu.be/_mbO-ndr740
Textos
complementarios VISAUTA. Análisis Estadístico con SPSS 17. Estadística Básica.
Editorial Mcgraw-Hill 2010
GENERALES
Estadística.
correspondientes en la administración.
UNIDAD 1
OBJETIVOS ESPECÍFICOS
CONTENIDO TEMÁTICO
1.3. POBLACION
Ejemplos
Todos los clientes de la empresa de cable Telecom en la provincia de Lima.
El total de alumnos del colegio “Pedro Ruiz Gallo” en el distrito de Chorrillos
La totalidad de Empresas del sector Minero del Perú en el año 2012
1.4. MUESTRA
Ejemplos:
• 50 clientes de la empresa de cable Telecom en la provincia de Lima
• 250 alumnos del colegio “Pedro Ruiz Gallo” en el distrito de Chorrillos
• 11 empresas del sector minero de Perú escogidas al azar.
DATO. Valor de la variable asociado con un elemento de la población o muestra. Puede ser
un número, una palabra o un símbolo.
UNIDAD ESTADÍSTICA. Los individuos u objetos de una población que tienen una
característica medible.
A. SEGÚN SU NATURALEZA:
1.8. SUMATORIAS
x
i 1
i x1 x2 ......... xn
Ejemplo:
4
* 2i 3 2(1) 3 2(2) 3 2(3) 3 2(4) 3 5 7 9 11 32
i 1
PROPIEDADES
n n
a) cxi c xi , para todo constante c
i 1 i 1
n n n
b) x i yi x i yi
i 1 i 1 i 1
n n n
c) x i yi x i yi
i 1 i 1 i 1
TEMA ORGANIZACIÓN DE DATOS EN TABLAS DE
II FRECUENCIA
Una vez recopilados los datos estos deben ser ordenados ó clasificados en tablas. Cuando
se dispone de un gran número de datos se debe distribuirlos en clases o categorías y
determinar el número de observaciones pertenecientes a cada clase, que es la frecuencia de
clase. Una distribución de frecuencias es un arreglo de los valores observados x1 , x2 , .....,xk
de la variable x con sus respectivas frecuencias, en una tabla de la forma:
Tabla 1
Valor de x fi Fi hi Hi
x1 f1 F1 h1 H1
x2 f2 F2 h2 H2
xk fk Fk n hk Hk
TOTAL k k
i 1
fi n h i 1
i 1
f1 f 2 f 3 ....... f k n
k
En notación sigma: f
i 1
i n
de observaciones realizadas ( n ). Sus valores son números reales que oscilan entre 0 y 1.
La suma de todas las frecuencia relativas es igual a 1. Se denota por:
fi
hi ; 0 hi 1
n
H 3 h1 h2 h3 ó Hi i
n n
H i h1 h2 h3 .... hi
SI AV NO AV SI NO AV SI SI SI
Utiliza:
NO NO SI SI SI AV SI SI SI AV
Si (siempre)
A veces NO NO AV NO NO SI SI NO AV NO
No (Nunca) SI SI SI SI SI SI NO NO SI SI
AV NO NO NO SI NO AV SI SI NO
Preferencia fi Fi hi Hi
Siempre 24 24 0.48 0.48
A veces 9 33 0.18 0.66
Nunca 17 50 0.34 1
Total 50 1
Interpretación:
f2: 9 amas de casa a veces utilizan el jabón
F2: 33 amas de casa siempre utilizan el jabón o a veces
h3: 34% de amas de casa nunca utilizan el jabón
H2: 66% amas de casa siempre utilizan el jabón o a veces
Son aquellas que se utilizan para agrupar datos cuantitativos de acuerdo a los diferentes
valores que toman las variables.
Ejemplo: Los siguientes corresponden al número de viajes que realizan por día un grupo
de vendedores entrevistados a azar en la empresa SPORTX
4 2 6 3 5 5 3 4 3 3
3 4 4 4 3 5 4 5 5 4
3 2 2 3 5 3 6 5 2 4
3 3 6 4 3 3 2 2 4 3
4 3 3 4 5 4 2 4 3 5
Tabla 3
TABLA DE FRECUENCIAS SOBRE EL NÚMERO DE VIAJES DE LOS
VENDEDORES
N° Viajes fi Fi hi Hi
2 viajes 7 7 0.14 0.14
3 viajes 17 24 0.34 0.48
4 viajes 14 38 0.28 0.76
5 viajes 9 47 0.18 0.94
6 viajes 3 50 0.06 1.00
Total 50 1.00
Interpretación:
f3:14 vendedores de SPORTX realizaron 4 viajes
F2: 24 vendedores realizaron menos 4 viajes (máximo 3)
H3: 76% de vendedores realizaron menos 5 viajes (máximo 4)
Paso1: Rango (R). Llamado también “recorrido de los datos”, es la diferencia entre el valor
máximo y el valor mínimo de la variable. Consideremos las siguientes variables
y1 , y2 , y3 , ......, yn , entonces: R Ymax Ymin
Paso3: Amplitud de Clase ( c ). Es el tamaño o longitud que deben tener los intervalos; se
recomienda tener intervalos del mismo tamaño. Se calcula mediante la fórmula:
R
c
m
Es la semisuma entre el límite superior y el límite inferior del intervalo de clase. Sea el
LI LS
intervalo LI LS entonces yi
2
Ejemplo: Los siguientes datos indican el número de minutos que ocuparon sus asientos 50
clientes en una cafetería:
73 65 82 70 45 50 70 54 32 75
75 67 65 60 75 87 83 40 72 64
58 75 89 70 73 55 61 78 89 93
43 51 59 38 65 71 75 85 65 85
49 47 55 60 76 75 69 35 45 63
Tabla 3
TABLA DE FRECUENCIAS SOBRE EL NÚMERO DE MINUTOS EN LA
CAFETERIA
Li Ls Yi fi Fi hi Hi
32 41 36.5 4 4 0.08 0.08
41 50 45.5 5 9 0.1 0.18
50 59 54.5 6 15 0.12 0.3
59 68 63.5 11 26 0.22 0.52
68 77 72.5 15 41 0.3 0.82
77 86 81.5 5 46 0.1 0.92
86 95] 90.5 4 50 0.08 1
50 1
Interpretación:
f3: 4 clientes ocuparon sus asientos como mínimo 32 minutos pero menos de 41
F4: 26 clientes estuvieron sentados menos de 68 minutos
h5: 30% clientes se sentaron al menos 68 minutos pero menos de 77
H3: ___________________________________________________________________
TEMA GRAFICOS ESTADISTICOS
III
Al igual que las tablas estadísticas, los gráficos estadísticos deben tener un título y una
explicación de QUE, DONDE y CUANDO se obtuvo la información. Tiene las siguientes
partes:
• El título principal
• Título secundario o subtítulo
• El gráfico propiamente dicho
• Fuente
• Las notas explicativas
• Interpretación
3.3.2 GRAFICO CIRCULAR. Sirve para representar, en términos de porcentaje, las distintas
partes de un todo. El área de cada sector circular representa el porcentaje sobre el total
de cada categoría. Ejemplo: Haz un diagrama de sectores para la siguiente tabla:
Año (%)
1995 16.9
1996 18.0
1997 18.5
1998 18.3
1999 18.5
2000 18.6
2001 18.0
2002 17.9
2003 18.6
Fuente: Cifras INE. 3/2007
2004 18.6
Li Ls fi hi
3.5 5.4 1 0.025
5.4 7.3 2 0.050
7.3 9.2 9 0.225
9.2 11.1 9 0.225
11.1 13 14 0.350
13 14.9 3 0.075
14.9 16.8 2 0.050
40 1
Li Ls fi Fi
3.5 5.4 1 1
5.4 7.3 2 3
7.3 9.2 9 12
9.2 11.1 9 21
11.1 13 14 35
13 14.9 3 38
14.9 16.8 2 40
40
ACTIVIDADES
EJERCICIOS DE APLICACIÓN DE UNIDAD1
1. Se realiza un muestreo de opinión para determinar si los clientes de un Supermercado, prefieren un
Celular con servicio de la compañía A con respecto a otras compañías. Con este fin se entrevistan a
1600 clientes y entre ellos 1200 prefieren la compañía A. Responda lo siguiente:
a) ¿Cuál es la población cuál es la muestra?
b) Cual es la variable analizada y su tipo
c) Identifique la estadística y proporcione su valor.
c) Identifique el parámetro de interés e indique su valor
3. Los siguientes corresponden a los delitos económicos registrados por la policía nacional durante el año
2012, se cuenta con 40 registros elegidos aleatoriamente.
B A B C A C A B A A
Utiliza:
D C A B D B A B D A A: Adulteración
A B C A A C A A B A B: Acaparamiento
A A B C A D B A A B C: Especulación
D: Piratería
a) Organice los datos en una tabla de distribución de frecuencias de acuerdo a los delitos económicos.
b) Interprete las siguientes frecuencias: f3 ; F2 ; h4 ; H 3
4. Los siguientes datos pertenecen a la distribución de la producción de papas (en toneladas) en 40 zonas
del país:
y1 20 ; f 2 f 5 2 ; y5 100 ; f1 4 ; f 3 20
Si se sabe que la distribución es simétrica y presenta 5 intervalos de clase con amplitud constante.
Construya una tabla de frecuencias.
5. En una clase de Estadística hemos medido la altura de los 25 alumnos. Sus medidas, en cm, son:
N° de empleados
LI LS yi fi Fi hi Hi
[ 82 12
[ 90 44
[
[ 30
[ ] 17
TOTAL 1.00
8. El siguiente gráfico representa un total de 600 elementos. ¿Cuál es la frecuencia de cada categoría?
AUTOEVALUACIÓN N° 1
1. El Gerente de Personal de una gran empresa manufacturera que cuenta con 1850 trabajadores, desea
conocer la experiencia promedio de un trabajador en el puesto que actualmente ocupa. Para ello
selecciona al azar 20 trabajadores de cada uno de los 6 departamentos que constituyen la empresa. Uno
de los trabajadores manifestó que tiene una experiencia de 6 años y medio. En esta condición identifique
a) Objetivo del problema ______________________________________________________________
b) Variable y tipo ____________________________________________________________________
c) Población ________________________________________________________________________
d) Muestra _________________________________________________________________________
e) Parámetro _______________________________________________________________________
3. Se ha realizado un estudio de las rentas de alquiler de 390 viviendas (donde la renta viene dada en
miles de soles), en una población de tamaño medio, obteniéndose:
Rentas de N° de viviendas
alquiler yi fi Fi hi Hi
[ 400 - 450 20
[ - 140
[ - 180
[ - 40
[ - ]
Total
a) Completa la tabla de frecuencias e interprete f3 y F2
b) ¿Qué porcentaje de viviendas tienen alquileres de al menos a S/.500?
c) Construya un polígono de frecuencias
____________________________________________________________________________________
____________________________________________________________________________________
____________________________________________________________________________________
UNIDAD 2
En esta unidad el alumno determinara las medidas de tendencia central y dispersión mediante
técnicas descriptivas y será capaz de resolver problemas, así como la aplicación de las leyes de
tendencia central y de variabilidad.
OBJETIVOS ESPECÍFICOS
Conocer los diferentes tipos de medidas de tendencia central para su aplicación en distintos
problemas según los datos que pueden ser no agrupados y agrupados.
Identificar las medidas de dispersión que más se utilizan y su aplicación en problemas de
distribución de frecuencia y en datos, así como diferenciar estas con las medidas de
centralización.
CONTENIDO TEMÁTICO
4.1. DEFINICIÓN
i 1
Xi
X 1 X 2 ........... X N
X
N N
Ejemplo1: Sea las edades en años de 5 niños son 8, 3, 5, 12 y 10. Entonces la Media
Aritmética de las edades de éstos niños es:
8 3 5 12 10 38
X 7.6
5 5
x x i
73 68 59 ... 59 72
63
n 10
Interpretación: Los empleados vendieron un promedio de 63 televisores.
4.1.2 CALCULO DE LA MEDIA PARA DATOS AGRUPADOS
Se Utilizará cuando los datos están distribuidos en una tabla de frecuencias. Luego
se calcula la media aritmética aplicando la fórmula:
n
fy i i
x i 1
; donde n es igual al número total de datos.
n
Inversiones
LI LS yi fi fi yi
[4 10 7 1 7
[10 16 13 3 39
[16 22 19 6 114
[22 28 25 12 300
[28 34 31 11 341
[34 40 37 5 185
[40 46 43 2 86
TOTAL n =40 1072
4.3. MODA
1
M o LI c j
2 1
Donde:
Observaciones:
La moda se puede determinar en todos los dos tipos de variables cualitativas y
cuantitativas.
La moda tiene la ventaja de no ser afectada por valores extremos
En muchas series de datos no hay moda porque ningún valor aparece más de una
vez.
Ejemplo: Calcule la moda de la siguiente distribución de frecuencia correspondiente la
inversión anual (en miles de dólares) de 40 empresas.
Inversiones
LI LS yi fi
[4 10 7 1
[10 16 13 3
[16 22 19 6
[22 28 25 12
[28 34 31 11
[34 40 37 5
[40 46 43 2
TOTAL n =40
Pasos:
Ubicamos primero la mayor frecuencia: f j 12
1 12 6 6 ; 2 12 11 1
6
Mo 22 6 28.857
6 1
Interpretación: El monto de inversión que más se repite es $28857 lo que significa
que la mayoría de las empresas invierte esa cantidad.
4.4. MEDIANA
La Mediana es valor que se encuentra en el centro luego de ordenar los datos y divide el
conjunto de datos en dos partes iguales.
4.4.1 MEDIANA DE DATOS NO AGRUPADOS
Para determinar la Mediana de n observaciones x1 , x2 ,........., xn primero se ordenan
n
2 F j 1
Me LI c j
F j F j 1
Donde:
LI : Límite inferior de la clase mediana
Observación:
Se denomina clase mediana al intervalo de clase que contiene a la mediana en una
tabla de distribución de frecuencias
Ejemplo: Calcule la mediana de la siguiente distribución de frecuencia correspondiente
la inversión anual (en miles de dólares) de 40 empresas.
Inversiones
LI LS yi fi Fi
[4 10 7 1 1
[10 16 13 3 4
[16 22 19 6 10
[22 28 25 12 22
[28 34 31 11 33
[34 40 37 5 38
[40 46 43 2 40
TOTAL n =40
Pasos:
n 40
i) Calcular 20 y ubicar en los Fi
2 2
ii) Luego la mediana se encuentra en la clase [22 28 , por lo tanto:
LI 22 ; Fj 22 ; Fj 1 10 ; ; c j =6
20 10 10
Me 22 6 22 6 27
22 10 12
5.1 DEFINICIÓN
Son medidas que nos dan el grado de concentración o dispersión de las observaciones
alrededor de un valor central o de posición. Las más comunes son:
Recorrido o rango
Varianza
Desviación Estándar o Típica
Coeficiente de Variación
Ejemplo: Sean las distancias de tres viviendas en dos muestras ¿en que muestra las
viviendas están más separadas o dispersas?
Ejemplo: Observando las edades de un grupo de personas: 6, 10, 16, 22, 36, 48 ,56
Hallar el rango de los datos. R 56 6 50 años.
5.3. VARIANZA Y DESVIACIÓN ESTÁNDAR
Xi X
N 2
POBLACIONAL 2
i 1 Xi N X 2 2
V(X) V(X )
N N
n n
x x xi2 nx
2 2
MUESTRAL i
s2 V ( x) i 1
i 1
s V ( x)
n1 n 1
fi X i X
N 2 N
2
fi X i N X
2
POBLACIONAL i 1 i 1
2 V(X ) V(X)
N N
n n
f i xi x fi xi2 nx
2 2
MUESTRAL
s2 V ( x) i 1
i 1
s V ( x)
n 1 n 1
OBSERVACIONES:
A la desviación estándar también se la llama desviación típica y es la raíz cuadrada
de la varianza. La varianza nunca es negativa.
Cuando la variable toma un único valor; es decir cuando es constante entonces la
varianza es cero.
Mientras más se aproxima a cero, más concentrados están los valores de la serie
alrededor de la media. Por el contrario, mientras mayor sea la varianza, más
dispersos están.
Ejemplo1: (cálculo de la varianza y desviación estándar para datos no agrupados)
El número de días necesarios por 10 equipos de trabajadores para terminar 10
instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80
días. Calcule e interprete la Varianza y Desviación Típica.
Varianza : s 2
475.12
10 1
Desviación estándar : s 475.12 21.8
Impuestos (miles) xi fi f i xi f i xi 2
35 41 38 4 152 5776
41 47 44 9 396 17424
47 53 50 14 700 35000
53 59 56 11 616 34496
59 65 62 8 496 30752
TOTAL n=46 2360 123448
fi xi 2360
Determinando la media: x n
46
51.3
123448 46(51.3) 2
La Varianza es: s 53.12
2
46 1
Es una medida relativa porque no tiene unidades de medida, se utiliza para comparar la
variabilidad de series de datos que tengan unidades diferentes ó de dos distribuciones
distintas (diferente tamaño de muestra o unidades). Se calcula mediante la fórmula:
S
C .V % 100 (Coeficiente de variación muestral)
X
OBSERVACIÓN:
Al realizar comparaciones entre dos variables, el C.V. mas pequeño será el que tenga
menor dispersión relativa.
Un C.V. mayor a 30% indica un alto grado de dispersión y pequeña representatividad de
la media, pero cuanto menor sea a 30% la media será mas representativa.
Conclusión
Comparando los tres coeficientes de variación se observa que el segundo obrero tiene
el menor coeficiente, por lo tanto dicho obrero tiene rendimiento más homogéneo o
uniforme
ACTIVIDADES
1. Una compañía de transportes conserva los registros del kilometraje en todo su equipo rodante. A
continuación se anotan los registros del kilometraje semanal de sus camiones:
810 450 756 789 210 657 589 488 876 689
1450 560 469 890 987 559 788 943 447 775
2. Las ventas de cinco vendedores de una empresa son: $8000, $9000, $10500, $9800 y $55000. Calcula
el sueldo medio, la moda y la mediana e indica cuál representa mejor a los datos.
Sueldos yi fi Fi yi fi
200 – 400 25
400 – 600 26
600 – 800 35
800 – 1000 8
1000 – 1200 15
5. Los costos de fabricación, en soles, de diez objetos son los siguientes: 9.35, 9.46, 9.20, 9.80, 9.77, 9.00,
9.99, 9.36, 9.50, 9.60, si el precio de venta de cada objeto es 3 veces su costo de fabricación menos 5
soles, calcular la utilidad media por objeto.
6. Se desea analizar el precio de las viviendas en el municipio de Surco para ello tras un minucioso estudio
en el registro de la propiedad y una agrupación de los datos se obtiene que durante los primeros 5
meses del presente año los precios vienen reflejados en la tabla siguiente y las unidades vienen dadas
en miles de dólares:
Li Ls Yi fi Fi Yi fi
- 880
- 1950
- 35 1800
- 13
- 200
- ] 4 70
90 110 42
33
110 130 12
9
130 150 8 3
a. ¿Qué proveedor proporciona las lámparas que tiene el mayor promedio de vida?
b. ¿Qué proveedor tiene las lámparas cuya duración tiene menor dispersión (más confiable)?
c. ¿Qué proveedor debería elegir el encargado de compras?
10. En una fábrica, el personal de planta está dividido en supervisores, operarios calificados y asistentes.
Se cuenta con la siguiente información:
Ingresos yi fi Fi hi Hi
[ - ) 5
[ - ) 10
[ - 25 ) 25
[ - 30 ) 35
[ - ) 22
[ - )
a) ¿Cuál es el gasto total anual para pagar el sueldo de todos los contadores?
b) ¿Qué medida me permite comparar la dispersión de salarios?
c) ¿Qué grupo de contadores tiene los sueldos más homogéneos?
x i 187 ; x 2
i 5009 ;
Calcule el Coeficiente de Variación e interprete.
UNIDAD 3
OBJETIVOS ESPECÍFICOS
CONTENIDO TEMÁTICO
Es frecuente que estudiemos sobre una misma población los valores de dos variables
estadísticas X e Y distintas, con el fin de ver si existe alguna relación entre ellas. El análisis
de este relacionamiento presenta dos aspectos diferentes.
Unas veces nuestro interés está en conocer si las dos variables están asociadas y medir
hasta qué punto los cambios en una pueden explicarse por los cambios que ocurren en la
otra. En tal caso tenemos un problema de correlación y la medida que cuantifica es el
llamado Coeficiente de Correlación.
Otras veces, cuando estamos seguros que existe un alto grado de asociación entre las dos
variables, el análisis se encamina a cuantificar la relación existente con el fin de predecir
cuáles serán los valores de la variable respuesta, en este caso tenemos un problema de
Regresión.
Correlación Positiva
(Directa)
Correlación Negativa
(Inversa)
Sin correlación
Ejemplo1: Los siguientes datos representan los años de práctica profesional y el ingreso
anual (en miles de soles) para un conjunto de servidores públicos. Construir el diagrama de
dispersion e indicar el tipo de correlación.
Años de
Practica (X) Ingreso (Y)
5 40
15 40
24 90
16 70
19 60
3 20
6 30
12 30
27 70
13 50
Interpretación: Observando el gráfico podemos decir los años de
práctica y el ingreso anual tienen una correlación Directa o Positiva.
Observación: Si se desea investigar la relación existente entre dos variables el primer paso
será trazar el diagrama de dispersión, el cual proporcionará una idea del tipo de relación
existente entre ambas variables.
Características:
iv) Si r 1 Existe una perfecta asociación positiva entre las dos variables
vi) Si r 0 No Existe asociación entre las dos variables, no existe asociación lineal.
Ejemplo2: Del ejemplo1 sobre los años de práctica profesional y el ingreso anual hallar
el coeficiente de correlación:
N° Años de XY X2 Y2
Practica(X) Ingreso(Y)
1 5 40 200 25 1600
2 15 40 600 225 1600
3 24 90 2160 576 8100
4 16 70 1120 256 4900
5 19 60 1140 361 3600
6 3 20 60 9 400
7 6 30 180 36 900
8 12 30 360 144 900
9 27 70 1890 729 4900
10 13 50 650 169 2500
Total 140 500 8360 2530 29400
∑X ∑Y ∑XY ∑ X2 ∑ Y2
n 10 ; x
x 140 14 ; y
500
50
n 10 10
Entonces:
n
xi yi nxy
i 1 8360 10(14)(50)
r 0.859
n x 2 nx 2 n y 2 ny 2
i i
2530 10(14) 2 29400 10(50) 2
i 1 i 1
Interpretación: Como r=0.859, existe una correlación positiva fuerte entre los años de
práctica y el ingreso.
Es un método que se emplea para encontrar una función que se ajusta a una nube de puntos
o diagrama de dispersión, con la finalidad de obtener una predicción aproximada de una de
las variables a partir de la otra. Es decir la función o ecuación nos permitirá hacer
pronósticos.
6.2.1 REGRESIÓN LINEAL SIMPLE. Este tipo de regresión se utiliza cuando existe solo
una variable independiente X para una variable dependiente Y. Está definida por la
siguiente ecuación lineal en su forma general:
Y b0 b1 X e
Donde:
e Es el error de predicción
A ei se le llama desviación o error que puede ser negativo o positivo, si elevamos las
desviaciones al cuadrado, para obtener la recta más representativa la suma de los
errores al cuadrado e12 e22 e32 ..... en2 debe ser lo más pequeña posible.
Ŷ b0 b1 X
Donde los valores de b0 y b1 en la ecuación de regresión son conocidos como
coeficientes de regresión y las fórmulas para calcularlos son:
n
xi yi nxy
b i 1 b0 y b1 x
1 n
x 2
i
nx 2
i 1
Ejemplo1: Una empresa tiene 7 vendedores, y se quiere analizar las ventas mensuales
(en miles de soles) frente a los años de experiencia. Los datos están en la siguiente
tabla.
Solución:
a) Diagrama de dispersión entre los años de experiencia y las ventas mensuales
Según el diagrama de dispersión existe una relación aproximadamente lineal.
Experiencia Ventas(miles)
N° XY X2 Y2
(X) (Y)
1 13 26 338 169 676
4 2 16 32 4 256
5 8 26 208 64 676
6 6 19 114 36 361
n 7 ; x
x 106 15.14 ; y
194
27.71
n 7 7
n
xi yi nxy
i 1 3478 7(15.14)(27.71)
b1 0.688
n
2390 7(15.14)2
x 2
i
nx 2
i 1
Ŷ 17.29 0.688 X
Interpretación:
b0 17.29 , Son las ventas de un empleado cuando X es cero o cuando no tienen
palabras es el aumento en S/. 688 por cada año de experiencia que adquiera un
empleado.
( x x )( y y )
2
R 2
r2
xi nx yi ny
2 2 2 2
Características:
Ejemplo2: Del ejemplo anterior sobre la regresión entre los años experiencia y las
ventas:
Interpretación: El 88.3% de la variación de las ventas (Y) son explicados por los años
de experiencia. Existe además un (100 -88.3)%=11.7% que no es explicado por los años
de experiencia.
Las preguntas anteriores esperan como respuesta una medida de confianza para conocer
un evento futuro, o bien de una forma sencilla interpretar la probabilidad. El estudio de las
probabilidades proporciona las reglas para el estudio de los experimentos aleatorios o de
azar, que constituyen la base para la estadística inferencial.
7.2. EXPERIMENTO
A. ESPACIO MUESTRAL
Es denotado por , es un conjunto formado por todos los posibles resultados de un
experimento.
1, 2, 3, 4, 5, 6
Ejemplo2: Sea el experimento lanzar dos monedas y observar el resultado, entonces
B. EVENTO O SUCESO
Un evento es un subconjunto del espacio muestral y se denota con las letras
mayúsculas A, B, C, etc.
1, 2, 3, 4, 5, 6
Para este experimento se pueden definir los siguientes eventos:
su espacio muestral será: ccc, ccs, csc, scc, css, scs, ssc, sss
Se definirá los siguientes eventos:
E: Observar que al menos 2 monedas sean caras. E ccc, ccs, csc, scc
F: Observar que salgan solo 1 sello en cualquiera de las tres. F ccs, csc, scc
7.5.2 PERMUTACIONES
Una permutación de un conjunto de elementos, es un ordenamiento específico de todos
o algunos elementos del conjunto, facilita el recuento de las ordenaciones diferentes
que pueden hacerse con los elementos del conjunto.En una permutación el orden en
que se disponen los elementos del conjunto es importante.
A. PERMUTACIONES DE n ELEMENTOS
Por el principio fundamental del conteo podemos enunciar que el número de
permutaciones de n objetos distintos tomados de n en n, es: Pn = n!
El símbolo ! se lee factorial y es el producto resultante de todos los enteros positivos
de 1 a n; es decir, sea n un número entero positivo, el producto n (n-1) (n-2)...3 x 2 x 1
se llama factorial de n.
n! = n (n -1 ) (n -2 )...3 x 2 x 1
5! = 5 x 4 x 3 x 2 x 1 = 120
Por definición 0! = 1
7.5.3 COMBINACIONES
Una combinación es un subconjunto o una disposición de todos los elementos de un
conjunto, sin tener en cuenta el orden de ellos. El número de combinaciones o
subconjuntos no ordenados, cada uno formado por r elementos, que pueden obtenerse
de un conjunto de n elemento es:
Ejemplo5: Se tienen cinco obreros para un trabajo especial que requiere de tres de
ellos. ¿De cuántas maneras diferentes se puede seleccionar un equipo de tres?
1
Sea el evento A 5 , un resultado favorable P ( A) 0,167
6
Determinar la probabilidad de que se obtenga un número par
3 1
Sea el evento B 2, 4, 6 , 3 resultados favorables P ( B ) 0, 5
6 2
iii. P 0
iv. P A B P A P B P A B .
Ejemplo8: En cierta ciudad, la probabilidad que una familia tenga televisor es 0.75, un
refrigerador es 0.60 y que tengan ambos es 0.50 ¿Cuál es la probabilidad que una
familia tenga un refrigerador o un televisor?
Solución: P (T ) 0.75 P ( R ) 0.60 P (T R ) 0.50
P T R 0 .7 5 0 . 60 0. 5 0 0 . 8 5
Ocurre cuando dos eventos se relacionan de manera tal que la probabilidad de ocurrencia
de uno depende de la ocurrencia del otro.
Definición: Sean A y B dos eventos tal que P( B ) 0 , la probabilidad condicional de que
ocurra el evento A dado que ha ocurrido B, se denota:
P( A B )
P( A / B )
P( B )
Ejemplo9: En una ciudad el 55% de los habitantes consume arroz, el 30% consume trigo y
el 20% consume ambos. Se pide: A= Arroz T= Trigo
a) ¿Cuál es la probabilidad de que coma trigo dado que consumió arroz?
P(T A ) 0.20
P(T / A ) 0.364
P( A ) 0.55
Ejemplo10: En una universidad el 70% de los estudiantes son de ciencias y el 30% de letras;
de los estudiantes de ciencias el 60% son varones y los de letras son varones el 40%. Si se
elige aleatoriamente un estudiante, calcular la probabilidad que:
a) Sea un estudiante varón
b) Sea un estudiante varón si es de ciencias
c) Sea un estudiante de ciencias si es varón
d) Sea un estudiante de ciencias y varón
P( C V ) 0.42
a) P(V ) 0.54 c) P( C / V ) 0.778
P(V ) 0.54
P(V C ) 0.42
b) P(V / C ) 0.6 d) P(V C ) 0.42
P( C ) 0.70
7.7.1 REGLA DE MULTIPLICACIÓN
Se define a partir de la probabilidad condicional:
Definición: Sean A y B dos eventos cualesquiera, entonces se tiene:
P( A B ) P( A )P( B / A ) P( B )P( A / B )
Ejemplo12: Se conoce que cierta máquina que produce tornillos trabaja correctamente
el 90% del tiempo. Si la máquina no está trabajando correctamente, el 5% de los tornillos
producidos son defectuosos. Cuando está trabajando bien solamente el 0.5% de
tornillos son defectuosos. Si se escoge un tornillo aleatoriamente ¿Cuál es la
probabilidad que sea defectuoso?
P( D ) P( C )P( D / C ) P( C )P( D / C )
= 0.90( 0.005 ) 0.10( 0.05 ) 0.0095
7.8. TEOREMA DE BAYES
Si los eventos A1 , A2 , ...., An forman una partición del espacio muestral , y B un evento
cualquiera de , entonces:
P( Ai )P( B / Ai )
P( Ai / B ) n
P( A )P( B / A )
i 1
i i
2. Una casa de empanadas realiza promociones a través de publicidad repartiendo volantes publicitarios.
Se cree que existe relación entre “x“ cantidad de volantes repartidos por semana en cientos e “ y ”
ventas en cientos de pesos. Se tomaron 8 semanas al azar que arrojaron la siguiente información:
a) Determine en qué medida la variable cantidad de volantes explica las variaciones de las ventas.
b) Determine la recta de ajuste e interprete los coeficientes.
c) Pronostique el valor las ventas, cuando se reparten 350 volantes.
3. Los siguientes datos corresponden al número de policías destacados por día (durante una semana) y
al número de asaltos que se produjeron en cierto distrito.
N° policías en servicio 20 40 45 60 32 25 28
N° de asaltos 54 25 20 12 27 48 42
6. Hay dos obras de 3 volúmenes y otras de dos volúmenes cada una ¿De cuantas maneras pueden
colocarse los diez libros en un estante, si deben quedar de tal manera que no se separen los volúmenes
de la misma obra?
7. Al planificar una familia de 4 niños, una pareja está interesada en los siguientes eventos:
A: Todos del mismo sexo B: Exactamente un varón C: Por lo menos dos varones
Liste los elementos de los eventos A, B y C
8. En una caja hay 20 bolas numeradas del 1 al 20. Se extrae al azar una bola ¿Cuál es la probabilidad
que el número de la bola extraída?
a) No exceda de 20 ; b) Sea el 32 ; c) sea por lo menos 15
9. De una baraja de 52 naipes bien mezclada se sacan 5 naipes. Hallar la probabilidad de que:
a) 4 sean ases; b) 4 sean ases y 1 rey;
c) 3 sean dieces y 2 Jotas ; d) al menos uno sea un as
10. Para obtener licencia para conducir, es necesario aprobar tanto el examen teórico como el práctico.
Se sabe que la probabilidad que un alumno apruebe la parte teórica es 0,68, la de que apruebe la parte
práctica es 0,72 y la de que haya aprobado alguna de las dos partes es 0,82. Si se elige un alumno al
azar, ¿cuál es la probabilidad de que apruebe el examen para obtener licencia?
11. Suponga que se estudia si el color del pelo está asociado al color de los ojos. Se analizaron 300
personas seleccionadas aleatoriamente con los siguientes resultados:
12. En un supermercado el 70% de las compras las realizan las mujeres; de las compras realizadas por
estas, el 80% supera los S/. 2000, mientras que de las compras realizadas por hombres sólo el 30%
supera esa cantidad. (Construya el diagrama del árbol)
a) Elegido un ticket de compra al azar, ¿cuál es la probabilidad de que supere los S/. 2000?
b) Si se sabe que el ticket de compra no supera los S/. 2000. ¿cuál es la probabilidad de que la
compra haya sido hecha por una mujer?
AUTOEVALUACIÓN N° 3
1. Un hipermercado ha decidido ampliar el negocio. Decide estudiar de forma exhaustiva el número de
cajas registradoras que va a instalar, para evitar grandes colas. Para ello, se obtuvieron los siguientes
datos procedentes de otros establecimientos similares acerca del número de cajas registradoras y del
tiempo medio de espera.
Nº de cajas registradoras 10 12 14 12 18 20
2. Un estudio de mercado en una ciudad indica que, durante cualquier semana, el 18% de los adultos
vieron un programa de televisión orientado a temas financieros y empresariales, el 12% leen una
publicación orientada a esta temática y el 10% realizan ambas actividades.
a) ¿Cuál es la probabilidad de que un adulto de esta ciudad vea el programa de televisión o lea la
publicación mencionada?
b) ¿Cuál es la probabilidad de que un adulto de esta ciudad, que lee la publicación, vea dicho
programa de televisión?
3. El administrador de una obra encargada de la construcción de una autopista, sabe que el terminar a
tiempo puede demorarse por causa de una huelga. Además sabe que debido al ambiente laborar, la
posibilidad de que exista una huelga es de 60%. También sabe que de no darse la huelga la
probabilidad de acabar a tiempo es de 85%, mientras que si la huelga se da es de 0.35.
a) ¿Cuál es la probabilidad de no acabar la obra a tiempo?
b) ¿Cuál es la probabilidad de que tras haberse acabado la obra, durante la misma se haya conjurado
una huelga?
c) ¿Cuál es la probabilidad de que dado que no se acabó la obra a tiempo no se haya conjurado la
huelga?
4. Se hace una encuesta en un grupo de 120 personas, preguntando si les gusta leer y ver la televisión.
Los resultados son:
A 32 personas les gusta leer y ver la tele.
A 92 personas les gusta leer.
A 47 personas les gusta ver la tele.
Si elegimos al azar una de esas personas:
a) ¿Cuál es la probabilidad de que no le guste ver la tele?
b) ¿Cuál es la probabilidad de que le guste leer, sabiendo que le gusta ver la tele?
c) ¿Cuál es la probabilidad de que le guste leer?
UNIDAD 4
OBJETIVOS ESPECÍFICOS
CONTENIDO TEMÁTICO
8.1. DEFINICIÓN
Una variable aleatoria X es una función que asigna un número real a cada resultado en el
espacio muestral de un experimento aleatorio. El conjunto de los posibles valores de la
variable aleatoria X se denomina rango.
X: 0, 1, 2
Rx x / x 0 ,1,2 ; en símbolos
w X(w)
Rx x1 , x2 , x3 , ......
Ejemplo2: En 100 días de trabajo, los records de los empleados se marcan cada día que
ellos están ausentes del trabajo. Se selecciona aleatoriamente un record y se observa los
días marcados. Hallar Rx
Rx 0,1,2,3, ....,100
p(x)=0 si x x j j=1,2,3....
X x1 x2 ……… xk
X 0 1 2
p(x) 1/4 2/4 1/4
F ( x ) P X x p( x i )
xi x
X 0 1 2
p(x) 1/4 2/4 1/4
F(x) 1/4 3/4 1
a) P X>b 1 P X b
b) P X<b P X b P X b
c) P a<X b P X b P X a
d) P a X b P X b P X a
e) P a X b P X b P X a
ii) E ax b aE x b
8.2.6 VARIANZA DE UNA V.A. DISCRETA
n
2 Var x E x E x 2 E( x ) ; donde E x 2 xi2 p( xi )
2 2
i 1
X 0 1 2 3 4
P(x) a 0.15 0.35 5a 0,20
Solución:
a) Aplicando la propiedad de que la suma de todas las probabilidades es 1 tenemos
que:
6a 0.70 1 entonces a 0.05
b) Hallando F(X)
X 0 1 2 3 4
P(x) 0.05 0.15 0.35 0.25 0,20
F(X) 0.05 0.20 0.55 0.80 1
P X 2 0.35
Ejemplo 1: Sea X la variable aleatoria “N° de kilogramos que pierde una persona” al seguir
una dieta durante cierto periodo. Su Rx pueden ser todos los puntos de un intervalo como
1;3 .
Ejemplo 2: Sea X: “Tiempo de vida de un transistor”. Es variable aleatoria continua por que
Rx puede ser 0;+
V.A. es una función f(x) integrable que se satisface las siguientes condiciones:
f(x) 0 ; x Rx
Rx
f ( x )dx 1
0 , En otros caso
0 2 3 0 2 9
2
2
x2 2 x3
b) P 1 x 2 3x x dx
2 13
2
1
9 3 27 1 17
EX x. f ( x )dx
Rx
Var x E x 2 E( x )
2
Donde: E x x
2 2
. f ( x )dx
Rx
3
3
2 x2
3
6 x3 2 x4 x4 2 x5
E X
2
3 x x 2
9 9
dx dx 2.7
0 6
0
9 45 0
TEMA DISTRIBUCIONES ESTADISTICAS PRINCIPALES
IX
1. Experimento: Lanzar una moneda: El experimento tiene solamente dos resultados (C,
S), por lo tanto es un experimento binomial.
2. Experimento: Probando una nueva medicina contra una enfermedad: la medicina cura
(éxito) o no cura (fracaso) la enfermedad. Por lo tanto es un experimento binomial.
iii) Los ensayos son independientes. Es decir, el resultado (éxito o fracaso) de cualquier
ensayo es independiente del resultado de cualquier otro ensayo.
Definimos la variable aleatoria X de la siguiente manera:
X( w ) : N° de éxitos en “n” ensayos de Bernoulli
n x n x
p q ; x 0,1,2,...,n
p( x ) P( X x ) x
0
; en otro caso
Donde: pq 1
0 ; x<0
x
n k n k
F( x ) P( X x ) p q ;0 x n
k 0 k
1 ; x n
Ejemplo1: Una factoría observa que en promedio, el 20% de las tuercas producidas por una
máquina son defectuosas. Si se toman 10 tuercas al azar, hallar
a) La probabilidad de que exactamente 2 sean defectuosas
10
a) P( X 2 ) 0.2 20.88 0.3020
2
b) P( X 2 ) 1 P( X 2 ) 1 P( X 0 ) P( X 1 )
10 10
1 0.200.810 0.210.89
0 1
1 0.1074 0.2684 0.6242
c) P( X 5 ) P( X 6 ) P( X 6 ) P( X 7 ) P( X 8 ) P( X 9 ) P( X 10 )
10 10 10 10
0.26 0.84 0.27 0.8 3 0.280.8 2 0.290.81 0.210
6 7 8 9
0.00637
(Usar tabla de distribución binomial que esta dado en P( X x ) )
10
d) P( X 0 ) 0.200.810 0.1074
0
e) E( X ) 10( 0.2 ) 2
e x
; x 0,1,2,...
p( x ) P( X x ) x!
0 ; en otro caso
Ejemplo1: Cierta oficina de bomberos recibe en promedio 3 llamadas por día. Calcular
la probabilidad de que:
a) Reciba 4 llamadas en un día
Solución:
e3 34
a) 3 ; P( x 4 ) 0.16803
4!
b) P( x 3 ) 1 P( x 3 ) 1 P( x 0 ) P( x 1 ) P( x 2 ) 1 0.423 0.577
Ejemplo 2: En la EUDED se reciben un promedio de 2 llamadas cada 3 minutos.
Asumiendo un proceso de Poisson:
a) ¿Cuál es la probabilidad que ocurran 5 ó más llamadas en un periodo de 9
minutos?
Solución:
a) Primero analizamos el periodo, en 9 minutos ¿Cuántas llamadas pueden darse?, si 2
llamadas se reciben cada 3 minutos, entonces en 9 minutos recibirán 6 llamadas.
Entonces 6
e 6 60
b) P( X 0 ) e 6 0.00248
0!
Var( X )
n e x
p( x ) P X x p x q n x ( se aproxima ) P X x
x x!
Ejemplo3: Supongamos que la proporción de personas que tienen cierta enfermedad
es 0.01. Determine la probabilidad que en un grupo aleatorio de 400 personas, al menos
6 personas tienen la enfermedad.
Solución: Vemos que X b( 400,0.01 ) , como n =400 es grande y p 0.01 pequeño
podemos aproximar np 400( 0.01 ) 4
P( x 6 ) 1 P( x 6 ) 1 P( x 5 ) (usar tabla)
1 0.785 0.215
Una variable aleatoria X tiene una distribución hipergeométrica si se toma una muestra sin
reemplazo de un conjunto de N elementos, de los cuales M son considerados de una categoría
en especial (éxitos) y los otros N-M son considerados de otra categoría (fracasos) y se desea
obtener x aciertos de una muestra de n elementos ó ensayos. Por ejemplo, un salón de clase
con N estudiantes, de los cuales M están aprobados y N-M desaprobados.
Definimos la variable aleatoria X de la siguiente manera:
X ( w ) Número de éxitos en la muestra de tamaño n sin reemplazo:
Rx 0,1, 2, 3, ....,min( n, M )
M N M
x n x para x 0,1, 2,....., min( n, M )
P ( x ) h ( x; N , n , M ) N
n
0 en otro caso
M
E( X ) n
N
nM M N n
2 Var( X ) 1
N N N 1
Ejemplo1: Una caja contiene 9 baterías de las cuales 4 están en buen estado y las restantes
defectuosas. Se toma una muestra eligiendo al azar tres baterías. Calcule la probabilidad
que en la muestra se obtengan,
a) Ninguna batería en buen estado
b) Al menos una batería en buen estado
c) No más de dos baterías en buen estado
Solución:
Este es un experimento de muestreo sin reemplazo, por lo tanto es un experimento
hipergeométrico con
N=9 (total de elementos del conjunto)
M=4 (total de elementos considerados ‘éxitos’)
n=3 (tamaño de la muestra)
X: cantidad de baterías en buen estado en la muestra (variable aleatoria discreta)
Entonces la distribución de probabilidad de X es:
4 9 4
x 3 x
P ( x ) h( x;9, 3, 4) = , x 0,1,2,3
9
3
4 9 4
0 3 0
a) P(X=0) = = 0.119
9
3
b) P(X1) = 1 – P(X<1) = 1 - 0.119 = 0.881
4 9 4 4 9 4 4 9 4
0 3 0 1 3 1 2 3 2
= + +
9 9 9
3 3 3
= 0.119 + 0.4762 + 0.3571 = 0.9523
Solución:
= 3(4/9) = 1.333 (es la cantidad promedio de baterías en buen estado
que se obtienen en la muestra)
3( 4 ) 4 93
2 = (1 )( ) = 0.555
9 9 91
9.4.1 DEFINICIÓN
Se dice que una variable aleatoria continua sigue una distribución normal de media
1 x 2
1 2
f ( x) e
2
9.4.2 PROPIEDADES DE LA DISTRIBUCIÓN NORMAL
La distribución normal tiene forma de campana con distribución de probabilidad que
tiene media = 0 y desviación estándar = 1.
El área bajo la curva o la probabilidad desde menos infinito a más infinito vale 1.
La distribución normal es simétrica, es decir cada mitad de curva tiene un área de
0.5.
La escala horizontal de la curva se mide en desviaciones estándar.
La forma y la posición de una distribución normal dependen de los parámetros y
, en consecuencia hay un número infinito de distribuciones normales.
( z ) P Z z ( u)du , z
z
X
Z
La cual tiene distribución N( 0,1 ) , esto es la V.A. Z tiene distribución normal con media
cero y varianza 1. Este tipo de procedimiento se denomina estandarización de la V.A.
X.
Ejemplo 2. El gerente de personal de una gran compañía requiere que los solicitantes
a un puesto efectúen cierta prueba y alcancen una calificación de 500. Si las
calificaciones de la prueba se distribuyen normalmente con media 485 y 30
520 485
P( x 520 ) P Z P Z 1.17 0.878
30
c) ¿Cuál es la probabilidad que un solicitante obtenga entre 450 y 510 en la prueba?
P( 450 x 510 ) P( x 510 ) P( x 450 )
510 485 450 485
PZ PZ P Z 0.83 P Z 1.17
30 30
= 0.79767 - 0.12167=0.676
ACTIVIDADES
EJERCICIOS DE APLICACIÓN DE UNIDAD4
1. Sea x una variable aleatoria que expresa el nº de personas que habitan en una vivienda elegida al
azar. La distribución de probabilidad de x es la siguiente:
xi 1 2 3 4 5 6 7
p(x) 0.230 K 0.177 0.155 0.067 0.024 0.025
a) Halla el valor de K
b) Obtener el nº medio de personas que habitan en una vivienda y su desviación estándar
c) Hallar la probabilidad que el nº de personas que viven en un hogar sea como máximo cuatro.
d) Calcular la probabilidad de que al menos dos personas vivan en una vivienda.
3. El tiempo T, en minutos, necesarios para que un Psicólogo evalúe a un empleado sobre sus aptitudes,
es una variable aleatoria con la siguiente distribución de probabilidad:
T 2 3 4 5 6 7
P(T) 0.15 2a 0.25 0.25 0.20 a
4. El número total de horas, medidas en unidades de 100 horas, que una familia utiliza una aspiradora en
un periodo de un año es una variable aleatoria continua X que tiene función de densidad:
k 0 x2
f ( x) k ( x 1) 2 x4
a) Hallar el valor k
b) Determinar su función F(x) y encuentre la probabilidad de que en un periodo de un año, una familia
utilice la aspiradora por lo menos de 50 horas pero menos 240
5. La opinión que tiene la población sobre la gestión de su Ayuntamiento es favorable en el 30% de los
casos y desfavorable en el resto. Elegidas 10 personas al azar, halla:
a) La probabilidad de que dos la consideren favorable.
b) La de que ninguno la considere desfavorable.
6. En una manzana de casas hay 10 aparcamientos. En cada aparcamiento puede encontrarse o no un
automóvil, con independencia de lo que ocurra en los otros. Si la probabilidad de que un aparcamiento
esté ocupado es de 0,4, se pide:
a) Identifica este modelo de probabilidad.
b) Calcula la probabilidad de que en cierto día se encuentren 8 automóviles aparcados.
c) Calcula la probabilidad de que estén los 10 aparcamientos ocupados.
7. Una prisión de máxima seguridad reporta que el número de intentos de escape por mes sigue una
distribución aproximadamente Poisson con una media de 1,5 intentos/mes. Calcule:
a. Probabilidad de tres intentos de escape durante el próximo mes.
b. Probabilidad de al menos un intento de escape el próximo mes.
8. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una
botella que contiene 9 píldoras de vitamina que son similares en apariencia. Si el oficial de la aduana
selecciona 3 tabletas aleatoriamente para analizarlas,
a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos?,
b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?
9. Un representante realiza 5 visitas cada día a los comercios de su ramo y por su experiencia anterior
sabe que la probabilidad de que le hagan un pedido en cada visita es del 0.4. Obtener:
a) El número medio de pedidos por día y la varianza
b) La probabilidad de que el Nº de pedidos que realiza durante un día esté entre 1 y 3.
c) La probabilidad de que por lo menos realice dos pedidos
10. El número medio de automóviles que llegan a una gasolinería es de 240 por hora. Si dicha estación
puede atender a un máximo de 8 automóviles por minuto, determine la probabilidad de que, en un
minuto dado, lleguen a la estación más automóviles de los que puede atender.
11. Un almacén recibió 2000 botellas de agua mineral. La probabilidad de que al transportar una botella
resulte rota es igual a 0.003. Hallar la probabilidad de que el almacén reciba rotas:
a) Exactamente tres botellas
b) Por lo menos 2
12. Entre los 16 aspirantes a obtener un empleo, 10 tienen grado universitario. Si para ser entrevistados
se elige al azar a tres de los solicitantes, ¿cuáles son las probabilidades de que:
a) Ninguno tenga un grado universitario b) Dos tengan grado universitario
13. Una empresa lleva a cabo una prueba para seleccionar nuevos empleados. Por la experiencia de
pruebas anteriores, se sabe que las puntuaciones siguen una distribución normal de media 80 y
desviación estándar 25. ¿Qué porcentaje de candidatos obtendrá entre 75 y 100 puntos?
14. Las ventas diarias, en euros, en un determinado comercio siguen una distribución con media
poblacional de 950 euros y desviación estándar de 98 euros. Calcula la probabilidad de que las ventas
diarias en ese comercio:
a) Superen los 1200 euros. c) Sean exactamente de 1000 euros
b) Estén entre 700 y 1000 euros. d) Sean al menos1100 euros
15. Gensa es una asociación internacional de personas con alto coeficiente intelectual. Para pertenecer a
ella, una persona debe tener un coeficiente intelectual de 132 o más alto (USA today, 13 de febrero de
1992). Si las calificaciones del coeficiente de inteligencia se distribuyen normalmente con promedio de
100 y desviación estándar de 15, ¿qué porcentaje de personas califican para ser miembros de Gensa?
AUTOEVALUACIÓN N° 4
1. El Gerente de ventas de la Librería “Estudia” ha determinado que la demanda por semestre del libro
“Harry Potter” es una variable aleatoria X con distribución de probabilidad:
X 10 20 30 40 50
P X 0.1 2k 0.2 0.3 3k
a) Hallar el valor de K
b) Cuanto es la demanda esperada de libros
c) Calcula la probabilidad que al demanda sea a lo mucho 30 libros
d) Calcula la probabilidad que al demanda sea al menos 20 libros menos 50
2. Se sabe que el 30% de la población de una determinada ciudad ve un concurso que hay en televisión.
Desde el concurso se llama por teléfono a 10 personas de esa ciudad elegidas al azar. Calcula la
probabilidad de que, entre esas 10 personas, estuvieran viendo el programa:
a) Al menos 6 personas pero no más de 8.
b) Menos de 5 personas
c) Halla la media y la desviación típica.
3. En una clase en la que hay 20 estudiantes, 15 están insatisfechos con el texto que se utiliza. Si se le
pregunta acerca del texto a cuatro estudiantes tomados al azar, determine la probabilidad de que:
a) exactamente tres estén insatisfechos con el texto.;
b) cuando menos tres estén insatisfechos.
4. Desde el año 1980 el número medio de empresas que han presentado suspensión de pagos ha sido de
6,8 por año y admitimos que el número de empresas X que han presentado suspensión de pagos
durante un periodo determinado de tiempo sigue una distribución de Poisson. Obtener:
a) Probabilidad de que ninguna empresa presente suspensión de pagos durante un trimestre.
b) Probabilidad de que por lo menos dos empresas presente suspensión de pagos durante un
determinado año.
5. Los depósitos en el banco de Arequipa durante el mes de Mayo último están normalmente distribuidos,
con media S/.10000 y una desviación estándar de 1500. Un depósito es seleccionado al azar de los
depósitos referentes al mes de Mayo. Encontrar la probabilidad de que el depósito sea:
a) menor de S/.14000
b) Por lo menos S/.12000
c) Un valor entre S/.12000 y S/.15000
SOLUCIONARIO DE AUTOEVALUACIONES
AUTOEVALUACIÓN DE UNIDAD I
3.
Rentas yi fi Fi hi Hi
[ 400 - 450 425 20 20 0.051 0.051
[ 450 - 500 475 140 160 0.359 0.410
[ 500 - 550 525 180 340 0.462 0.872
[ 550 - 600 575 40 380 0.103 0.974
[ 600 - 650 ] 625 10 390 0.026 1.000
Total
a) Interpretación
f3: 180 viviendas pagan mínimo S/. 500 en rentas pero menos de S/.550
F2: 160 viviendas pagan menos de S/.500 en rentas
b) 58.97%
4. Interpretación: Según el gráfico las exportaciones son mayores a las importaciones desde el 2000
hasta el 2003, teniendo un saldo positivo además el mayor crecimiento de exportaciones fue en el 2002
AUTOEVALUACIÓN DE UNIDAD 2
1.
Ingresos yi fi Fi hi Hi
10 15 12.5 5 5 0.04 0.04
15 20 17.5 10 15 0.08 0.13
20 25 22.5 25 40 0.21 0.33
25 30 27.5 35 75 0.29 0.63
30 35 32.5 22 97 0.18 0.81
35 40 37.5 23 120 0.19 1.00
2.
Grado n x S n. x C.V
I 18000 8000 800 144000000 0.100
II 13000 9500 950 123500000 0.100
III 5500 11500 1100 63250000 0.096
330750000
3. A) c B) b C) d D) b
AUTOEVALUACIÓN DE UNIDAD 3
1. 70
y = ‐3.2301x + 84.965
60
R² = 0.742
Tiempo de espera
50
40
30
20
10
0
0 5 10 15 20 25
Numero de Cajas registradoras
3.
4.
73 32 92
a) P (T ) 0.608 b) P( L / T ) 0.681 c) P ( L) 0.767
120 47 120
AUTOEVALUACIÓN DE UNIDAD 4
X 10 20 30 40 50
P X 0.1 0.16 0.2 0.3 0.24
a) K=0.08
b) Demanda esperada E(X)= 34.2
c) P ( X 30) 0.46
p 0.3 q 0.7 n 10
a) P (6 X 8) P ( X 8) P ( X 6) 0.047
b) P ( X 5) 0.8497
15 5
x 4-x
20
a) P ( X 3) 0.4695
b) P ( X 3) 0.7512
e x
6.8 (por año) P( X x )
x!
X N( 10000,1500 2 )
a) P ( X 14000) 0.9962
b) P ( X 12000) 0.0912
De las tres medidas de posición central, la media aritmética suele ser más frecuentemente
utilizado, quizá por la facilidad de su cálculo a pesar de que en muchas ocasiones la mediana o
pero a causa de esta propiedad, puede ser desventajosamente afectado por la existencia
de valores anormalmente altos o anormalmente bajos. Por regla general, sin embargo
puede decirse que cuando la serie es más o menos simétrica, el promedio debe ser
b) La mediana por su parte debe ser utilizada cuando entre los valores que se estudian, hay
alguno muy diferente entre los otros. Si por ejemplo, los gasto administrativos mensuales
de 5 compañías constructoras del mismo nivel fuera respectivamente 2000, 3000, 4000,
6000 y $30000; el valor último, debido tal vez a que la compañía indemnizo a algún
los valores extremos, dando una impresión más acorde con lo usual.
Hay además ocasiones en que debe usarse la mediana por no ser posible el calculo del
promedio. Tal sucede en aquellas distribuciones en las cuales la primera o la última clase
aritmética, pues su valor depende solamente del número de términos sin tomar en cuenta
c) La moda no es una medida de tendencia central muy usual, pero se emplea cuando el
interés se centra en conocer el valor que se presenta más frecuentemente. Por ejemplo
en los negocios, sirve para determinar qué tamaño del producto es el de mayor demanda.
ANEXO 2
TABLA DE DISTRIBUCIÓN NORMAL ESTANDAR A1
GLOSARIO DE TERMINOS
A
ALEATORIO. Que depende del azar o de la suerte. Se aplica para escoger la muestra dentro de una
población.
B
BERNOULLI. Es un experimento que tiene dos posibles resultados mutuamente excluyentes,
generalmente llamados “éxitos” y “fracasos”
C
COEFICIENTE DE VARIACIÓN. Es una medida relativa de dispersión y se utiliza para comparar el
grado de dispersión de dos distribuciones o muestras distintas. Es la razón entre la desviación estándar y
el promedio.
CORRELACION. La correlación es la teoría que se encarga de estudiar las posibles relaciones existentes
entre dos variables X e Y estadísticas
D
DESVIACIÓN ESTÁNDAR ( ). Es una medida de dispersión muy importante y expresa el grado de
dispersión o alejamiento de las observaciones respecto a la media aritmética. Matemáticamente es la raíz
cuadrada de la varianza.
DATO. Valor de la variable asociado con un elemento de la población o muestra. Puede ser un número,
una palabra o un símbolo.
E
ESTADÍGRAFO O ESTADÍSTICA. Es toda medida resumen o característica de la muestra.
EXPERIMENTO ALEATORIO. Llamado también No determinístico donde cada experimento podrá ser
repetido indefinidamente sin cambiar esencialmente las condiciones.
ESPACIO MUESTRAL. Es denotado por , es un conjunto formado por todos los posibles resultados de
un experimento.
EVENTO. Un evento es un subconjunto del espacio muestral y se denota con las letras mayúsculas A,
B, C, etc. Se cumple: Si A es un evento A
G
GRAFICO ESTADISTICO. El gráfico es la representación de la información estadística, con el fin de
obtener una impresión visual global del material presentado, que facilite su rápida comprensión.
GRAFICO CIRCULAR. Sirve para representar, en términos de porcentaje, las distintas partes de un todo.
El área de cada sector circular representa el porcentaje sobre el total de cada categoría
H
HISTOGRAMA. Es una representación gráfica de una distribución de frecuencias agrupadas en intervalos
de clase, mediante una serie de rectángulos contiguos.
HIPERGEOMÉTRICA. Una variable aleatoria X tiene una distribución hipergeométrica si se toma una
muestra sin reemplazo de un conjunto de N elementos.
M
MEDIDAS DE DISPERSIÓN O DE VARIABILIDAD. Son medidas que nos dan el grado de concentración
o dispersión de las observaciones alrededor de un valor central o de posición. Las más comunes son:
Recorrido o rango, Varianza, Desviación Estándar o Típica y Coeficiente de Variación.
MEDIA ARITMETICA. Llamado también promedio, se define como el cociente de la suma de los valores
de una variable entre el número de observaciones o valores.
MEDIANA. La Mediana es valor que se encuentra en el centro luego de ordenar los datos y divide el
conjunto de datos en dos partes iguales.
MODA. La moda de un conjunto de observaciones es el valor que se presenta con más frecuencia o el
que más se repite.
MARCO MUESTRAL. El listado completo de las unidades de muestreo. Nos permite identificar a los
elementos de la población y puede ser una relación de viviendas, un listado de personas, una relación de
reactivos químicos, etc.
P
POBLACIÓN. Es el conjunto total de individuos, objetos o medidas que poseen algunas características
comunes observables en un lugar y en un momento determinado.
PROBABILIDAD CONDICIONAL. Ocurre cuando dos eventos se relacionan de manera tal que la
probabilidad de ocurrencia de uno depende de la ocurrencia del otro.
POISSON. Es otra distribución discreta importante y es generalmente utilizada en los problemas en que
se cuentan el número de eventos de cierto tipo, que ocurren en un intervalo de tiempo, o en una región, o
en un volumen.
R
RANGO O RECORRIDO. Es la diferencia entre el valor mayor y menor de una variable. Su fórmula es:
R X max X min
Ejemplo: Observando las edades en años de un grupo de personas: 6, 10, 16, 22, 36, 48 ,56 Hallar el
rango de los datos. R 56 6 50 años.
REGRESIÓN. Es un método que se emplea para encontrar una función que se ajusta a una nube de
puntos o diagrama de dispersión, con la finalidad de obtener una predicción aproximada de una de las
variables a partir de la otra.
REGRESIÓN LINEAL SIMPLE. Este tipo de regresión se utiliza cuando existe solo una variable
independiente X para una variable dependiente Y. Está definida por la siguiente ecuación lineal en su
forma general: Y b0 b1 X e
T
TABLA DE DISTRIBUCION DE FRECUENCIAS. Una tabla es un esquema para resumir la información.
Una distribución de frecuencias es un arreglo de los valores observados x1 , x2 , .....,xk de la variable x
con sus respectivas frecuencias
U
UNIDAD ESTADÍSTICA Y OBSERVACIÓN. Los individuos u objetos de una población que tienen una
característica medible se denomina unidad estadística. El término observación se utilizará para indicar
cualquier clase de medida obtenida en la investigación, es el resultado de observar o medir una unidad
estadística.
V
VARIANZA ( 2 ). La Varianza es una medida de dispersión importante y expresan el promedio del
cuadrado de todas las desviaciones con respecto a la media aritmética. (Una desviación de un conjunto
de datos es la resta entre un dato y el promedio global: X i X )
VARIABLES. Son características de personas u objetos que pueden tomar diferentes valores. Por
ejemplo, la estatura de las personas, el número de personas que residen en una vivienda, el número de
clientes que atiende un hotel al mes, el ingreso familiar, etc.
VARIABLES CUANTITATIVAS (Numéricas). Son aquellas que toman valores numéricos y se pueden
medir y a su vez se clasifican en discretas o continuas.
VARIABLE INDEPENDIENTE. Es aquella que el investigador desea medir su efecto y está bajo su control.
Por ejemplo, consideremos un experimento diseñado para medir la efectividad de dos fertilizantes en la
producción de trigo, el experimentador tiene bajo su control los fertilizantes, por lo cual “el fertilizante” se
denomina variable independiente.
VARIABLE DEPENDIENTE. Son todas aquellas variables que son explicadas por el modelo y reflejan el
efecto de las variables independientes. En el ejemplo anterior “la producción de trigo” en cada parcela se
denomina variable dependiente.