GHK

1.
INTRODUCCIÓN
CONTENIDO
1 INTRODUCCION ................................................................................... 2
1.1 PROPOSITO DE LA ESTADISTICA .................................................... 2
1.1.1 SITUACIONES DE APLICACIÓN ............................................ 2
1.1.2 TRABAJO DE APLICACIÓN ..................................................... 4
1.2 EJEMPLO DE INTRODUCCION ......................................................... 5
1.3 LENGUAJE DE LA ESTADISTICA ...................................................... 6
1.4. MUESTRA ................................................................................................ 7

1.4.1 ¿POR QUÉ SE TOMAN MUESTRAS? .......................................... 8
1.4.2 ERRORES DE LAS MUESTRAS .................................................... 9
1.5 RECOLECCION DE DATOS .................................................................. 9

INTRODUCCION 2
1 INTRODUCCION
1.1 PROPOSITO DE LA ESTADISTICA

Diariamente los medios de comunicación “bombardean” con datos. Las “estadísticas” se nutren
de los números generados por espacios informativos, publicidad, resultados de eventos
deportivos, sondeos de opinión, debates públicos, etc.. Las organizaciones modernas tienen
gran variedad de datos en sus archivos de documentos y en las computadoras. Cientos o miles
de valores se agregan a este total todos los días.
Algunos de los datos nuevos se generan normalmente durante el registro de las actividades;
otros son el resultado de estudios e investigaciones especiales.
Sin los procedimientos estadísticos, ninguna organización podría transformar en información
útil la gran cantidad de datos generados por su actividad.
El análisis estadístico nos provee un conjunto de principios y procedimientos para

manipular, resumir e investigar datos con el fin de obtener información útil en la toma de
decisiones.
El tratamiento estadístico de los datos requiere el empleo de computadoras. Este material de

trabajo proporciona numerosos ejemplos de salidas de computadora, resueltos con planilla de
cálculo : EXCEL y con software estadístico : MINITAB y SPSS. Existen otros en el mercado que
realizan funciones similares.
1.1.1 SITUACIONES DE APLICACION

En todas las profesiones es importante la recolección y el estudio de datos; por eso los
conocimientos de estadística son valiosos para una gran variedad de carreras.
• Las oficinas de estadística del gobierno publican cada mes nueva información numérica
sobre la inflación y el desempleo, a través de índices de precios, tasa de desempleo, etc.
• Quienes se dedican a realizar previsiones, los economistas, los asesores financieros y los
que determinan las políticas de una empresa, industria y del gobierno estudian estos datos
para tomar decisiones basadas en la información obtenida.
• Con el fin de ofrecer un tratamiento adecuado a sus pacientes, los dentistas, los médicos y
en general el personal de un centro de salud, deben entender la información estadística de
las investigaciones que se publican en las revistas médicas sobre efectos de nuevas
drogas, tratamientos de enfermedades, etc.
• En política, los funcionarios que ocupan cargos directivos consideran las estadísticas de la
opinión pública para definir la legislación que quieren sus votantes.
• Las empresas basan sus decisiones en estudios de mercado sobre los patrones de compra
de los consumidores, pruebas de nuevos productos, etc.
G.Carnevali-E.Franchelli-G.Gervasoni
INTRODUCCION 3
• Los ingenieros de control de calidad recopilan datos sobre la fiabilidad de partes y

productos fabricados, calidad de procesos, etc. para mejoramiento del producto.
De acuerdo con la experiencia, virtualmente toda persona involucrada en la toma de decisiones
necesita conocimientos de análisis estadístico. Muy frecuentemente, en especial en compañías
grandes, se utiliza la estadística en forma habitual. Cuando se solicita personal para esos
trabajos, se piden conocimientos sólidos de análisis estadístico.
En cualquiera de estos u otros ejemplos se puede observar que tanto el registro de los datos
que interesan, como su manejo o utilización, no siempre es simple y se necesitan
procedimientos adecuados para llevarlos a cabo.
En las situaciones presentadas se individualiza:
UN OBJETIVO
Para lo cual se debe
ANALIZAR EL COMPORTAMIENTO DE UNA O VARIAS CARACTERISTICAS
en función de
UN CONJUNTO DE RESULTADOS
que presentan
VARIABILIDAD
INTRODUCCION 4
1.1.2 TRABAJO DE APLICACION
Conteste la siguiente encuesta, la misma se repite en hoja adjunta para ser entregada a su
profesor en forma completa.
Comisión: ............
CUESTIONARIO PARA LA BASE DE DATOS ESTUDIANTIL
NOMBRE Y APELLIDO : ………………………………………………….
SEXO : …………… EDAD : ………… AÑO DE INGRESO A LA UTN : .................
1.- Marque con una cruz en el casillero correspondiente :
MATERIA APROBADA REGULAR CURSADA SIN CURSAR CURSANDO
Análisis MatemáticoI
Algebra y Geometría
Matemática Discreta
Análisis Matemático II
2.- Número de materias aprobadas ......................
3.- ¿Es recursante en Probabilidad y Estadística? No Si
¿A qué lo atribuye? …………………………………………………………………....
4.- ¿Es recursante en otra Asignatura? No Si
¿Cuál o cuáles?
………………………………………………………………………………….
5.- ¿Trabaja? No Si
¿Cuántas horas por día? ………………………………………………………………
Ejercicio
Plantee algún objetivo para el cual pudo haber sido implementada la encuesta y reconozca:
Ö
Ö las características de estudio y
Ö
Ö en quiénes se estudia.
INTRODUCCION 5
1.2 EJEMPLO DE INTRODUCCION
Antes de cada acto electoral se efectúan encuestas de la opinión pública a fin de obtener
información sobre la proporción de población que votará por cada candidato (objetivo).
En la ciudad de Rosario, para las elecciones realizadas el 7 de septiembre de 2003, distintas
consultoras realizaron encuestas. El diario “La Capital” de Rosario publicó el día miércoles 10
de septiembre de 2003 los resultados de las encuestas y los resultados obtenidos en la
elección para gobernador e intendente:
INTRODUCCION 6
Consultar a todos los votantes para lograr este objetivo, es obvio que sería una labor imposible;
como única alternativa se investiga una muestra de ellos con la expectativa de que la
proporción de votos para cada candidato en la muestra, se aproxime lo más posible a la
correspondiente proporción en la población.
Este es un ejemplo típico de inferencia estadística: a partir de la proporción muestral se
infiere la correspondiente proporción poblacional.
Como lo advertiría cualquier investigador de la opinión pública se trata de un trabajo incierto.
Para tener seguridad respecto a la proporción de votos de cada candidato en la población es
preciso esperar hasta que se cuenten todos los votos el día de la elección.
Sin embargo, si el muestreo se realiza en forma imparcial y adecuada es probable que la
proporción muestral se aproxime a la proporción poblacional.
Ante este planteo nos podemos preguntar:
9 ¿cómo obtener una muestra imparcial y adecuada?
9 ¿qué error se puede estar cometiendo al inferir sobre la población muestreada a
partir de la información que nos da la muestra?
9 ¿qué seguridad tenemos de estar en lo cierto?
Este planteo representa la esencia del curso y se trabajará específicamente a lo largo de los
capítulos.
1.2 LENGUAJE DE LA ESTADISTICA
¾ Población: es el grupo total de objetos (elementos, personas, registros, instituciones,

períodos de tiempo, etc.) acerca del cual se obtienen conclusiones. En cuanto al tamaño,
una población puede ser finita o infinita.
¾ Variable: es la característica de interés que interesa observar en la población en relación al

objetivo de estudio. Se puede clasificar en:
• Variable cuantitativa (o simplemente variable): es aquella cuyos valores surgen
naturalmente como cantidades numéricas. Ej.: salario, edad, diámetro, número de
clientes, etc. A su vez se clasifica en:
- discreta: cuando sólo puede asumir valores aislados (asociada
generalmente a situaciones de conteo).
- continua: cuando puede asumir cualquier valor en el intervalo real.
• Variable cualitativa (o atributo): sólo puede clasificarse o a lo sumo jerarquizarse. Ej.:
sexo, raza, nivel de instrucción, etc.
¾ Unidad de análisis: es cada uno de los objetos sobre los que se realiza la observación de
una o más variables.
INTRODUCCION 7
¾ Censo: es un intento de medir todos los elementos de una población de interés. En muchos
casos el censo es impracticable, ya sea porque la población es infinita, porque la
observación implica la destrucción de la unidad, por razones de costos, etc.
¾ Parámetro: es una medida que resume información de una característica o variable. Se

calcula a partir de todas las unidades de la población. Por ej.: promedio y proporción
poblacional.
¾ Muestra: es una parte de la población que se usa como información.
¾ Estadístico: es una medida que resume información de una variable, pero calculada con
los datos de la muestra. Por ej.: promedio y proporción muestral.
¾ Inferencia estadística: es el proceso de extraer conclusiones sobre la población

basándose en la información de una muestra extraída de esa población.
Complete en el ejemplo de introducción:
Ö
Ö Población:
Ö
Ö Unidad de análisis:
Ö
Ö Variable de estudio:
Ö
Ö Tipo de variable:
Ö
Ö Parámetro de interés:
1.4 MUESTRA
Muy frecuentemente es necesario seleccionar una muestra de unidades de la población, para

extraer conclusiones respecto de la población en base a las observaciones muestrales.
La selección de una muestra representativa es un problema importante en las investigaciones
estadísticas ya que ésta puede proporcionar una visión útil de la naturaleza de la población que
se estudia, mientras que una muestra no representativa puede sugerir conclusiones totalmente
erróneas sobre la población.
El punto esencial en el muestreo es tratar de que los elementos de la muestra representen a la
población tan fielmente como se pueda. Por lo general, esta tarea es más difícil de lo que
parece. Con frecuencia debe dedicarse mucho tiempo y atención al proceso de selección, ya
que una vez medidos los elementos se supondrá que la muestra es representativa de la
población.
Para ello, es importante que la selección de las unidades de análisis que intervengan en la
muestra no esté influenciada por cuestiones de conveniencia o favoritismo.
INTRODUCCION 8
La alternativa adecuada es utilizar el azar. Las muestras seleccionadas en forma aleatoria son
muestras probabilísticas. En el curso se trabajará con muestras aleatorias simples:
Una muestra aleatoria simple se obtiene cuando se seleccionan n elementos de una

población, de manera que todas las combinaciones posibles de n elementos de la población
tienen igual posibilidad de ser elegidas.
La tabla de números aleatorios proporciona listas de números generados al azar que pueden
usarse para elegir muestras aleatorias.
La mayoría de las calculadoras manuales y casi todos los paquetes de computadora generan
listas de números aleatorios que pueden usarse para seleccionar muestras aleatorias.
En el Apéndice 1 se adjunta una tabla de números aleatorios.
Además de la muestra aleatoria simple, existen otras técnicas de muestreo probabilístico
apropiadas a distintas situaciones que no serán analizadas en el presente curso.
1.4.1 ¿POR QUE SE TOMAN MUESTRAS?
Se utilizan muestras y no se estudia la población total por cualquiera de las razones siguientes:
9 Recursos limitados
9 Datos disponibles limitados.
9 Prueba destructiva
9 Mas exactitud
1. La limitación de los recursos (tiempo, dinero, etc.) desempeña siempre un papel importante
que justifica el uso de muestras. Si la población es grande, el censo ocasiona un costo
elevado y muchas veces, aunque económicamente se pudiera realizar, llevaría tanto tiempo
que la información no resultaría de interés.
En este mundo tan cambiante, el muestreo permite conseguir la información rápidamente en
un momento determinado.
2. A veces, independientemente de los recursos, sólo existe una pequeña muestra. Por
ejemplo, se puede tener a prueba una máquina que se supone más eficiente que otras,
para decidir si se compran unidades semejantes. El gerente de control de calidad
sencillamente no puede esperar hasta observar la población completa de los productos de
esta máquina, en lugar de ello, debe observar una muestra de productos de dicha máquina
y basar su decisión en una inferencia que hace a partir de dicha muestra.
3. El muestreo puede implicar una prueba destructiva. Por ejemplo, suponga que se desea
conocer el promedio de vida de los focos producidos por una fábrica determinada. Sería
insensato esperar a que todos los focos se quemaran para conocer su promedio de vida.
4. Un censo no ofrece garantía absoluta de calidad. La observación de toda la población puede
ser una tarea enorme que lleve a cometer muchos más errores que cuando se observa una
muestra cuidadosamente diagramada. Por ejemplo, una gran cantidad de personal poco
INTRODUCCION 9
capacitado puede cometer errores de medición que no cometería una menor cantidad de
personal mejor capacitado.
1.4.2. ERRORES DE LAS MUESTRAS
Retomando el ejemplo de las encuestas previas a la elección, puede suceder que la proporción
de votos obtenida por cada uno de los candidatos en la muestra, quizás represente muy mal a
la correspondiente en la población, por distintas razones:
- Independientemente de lo bien dirigido y diseñado que esté el procedimiento de muestreo,
puede ocurrir que se obtenga una muestra de votantes “no representativa” de la población.
Estos casos de mala suerte son posibles pero no probables.
- El otro problema consiste en que el muestreo puede estar mal diseñado. Por ejemplo,
cuando se muestrea una población de votantes es erróneo tomar sus nombres de una guía
telefónica, puesto que quedarán excluidos los votantes que no poseen teléfono.
1.5 RECOLECCION DE DATOS

Los datos se pueden obtener por observación o por experimentación. Si simplemente se
observa la característica de interés sin intervenir en el proceso en estudio, se está ante un
estudio observacional. En cambio si se interviene en el proceso en estudio imponiendo algún
tratamiento en forma deliberada sobre las unidades de análisis a fin de observar las
respuestas, se está ante un experimento.
Según el tipo de fuente, los datos pueden ser primarios o secundarios. Los datos primarios se
recogen específicamente para el análisis deseado. Los datos secundarios ya se han
compilado y están disponibles para el análisis estadístico.
La ventaja de usar datos secundarios para una investigación estadística es que ya se dispone
de ellos y no es necesario recogerlos para un proyecto específico. Incluso la compra de los
datos a una compañía comercial es por lo general menos costosa que obtener datos primarios.
La desventaja de los datos secundarios es que estas fuentes no siempre cubren las
necesidades específicas del análisis y además no siempre son confiables. Esta es la razón por
la que muchos investigadores requieren obtener datos primarios orientados específicamente al
asunto que se está investigando.
Se requiere experiencia para determinar qué técnica o combinación de técnicas se adecuan
mejor a la tarea de obtener la información necesaria de las unidades de análisis. La clave para
realizar una buena investigación reside, en gran medida, en la pericia del analista a la hora de
elegir la técnica idónea.
Ejercicio
En las situaciones planteadas en el ejercicio de la pag. 4:
Ö
Ö Identifique la población o las poblaciones en estudio para el objetivo planteado.
Ö
Ö Analice si los datos obtenidos constituyen una población o una muestra.
Ö
Ö Clasifique las características en estudio
Ö
Ö Identifique parámetros de interés.
U.T.N. FACULTAD REGIONAL ROSARIO
INGENIERIA EN SISTEMAS DE INFORMACION
PROBABILIDAD Y ESTADISTICA AÑO : 2008
Comisión: ............
CUESTIONARIO PARA LA BASE DE DATOS ESTUDIANTIL
NOMBRE Y APELLIDO : …………………………………… ….. LEGAJO : …………………
CORREO ………………………………………………………………………………….
SEXO : ………… EDAD : …………… AÑO DE INGRESO A UTN ..........................
Marque con una cruz en el casillero correspondiente:
1.-
MATERIA APROBADA REGULAR CURSADA SIN CURSAR CURSANDO
Análisis Matemático I
Algebra y Geometría
Matemática Discreta
Análisis Matemático II
2.- Número de materias aprobadas ......................
3.- ¿Es recursante en Probabilidad y Estadística? No Si
¿A qué lo atribuye? …………………………………………………………………....
4.- ¿Es recursante en otra Asignatura? No Si
¿Cuál o cuáles? ………………………………………………………………………………….
5.- ¿Trabaja? No Si
¿Cuántas horas por día? ………………………………………………………………
2. ESTADISTICA
DESCRIPTIVA
CONTENIDO
2 ESTADISTICA DESCRIPTIVA................................................................................... 11
2.1 DISTRIBUCIONES DE FRECUENCIAS Y GRAFICOS 11
2.1.1 DATOS CORRESPONDIENTES A UN ATRIBUTO 11
2.1.2 DATOS CORRESPONDIENTES A UNA VARIABLE DISCRETA 14
2.1.3 DATOS CORRESPONDIENTES A UNA VARIABLE CONTINUA 16
2.1.4GRAFICAS DE SERIE DE TIEMPO 22
2.2 MEDIDAS CARACTERISTICAS DE UNA DISTRIBUCION DE

FRECUENCIAS. 25
2.2.1 MEDIDAS DE POSICION 26
2.2.2 MEDIDAS DE DISPERSIÓN 29
2.2.3 COEFICIENTE DE VARIACION 32
2.3 REGLA EMPIRICA 33
2.4 DIAGRAMAS DE CAJA O BOX - PLOT 34
2.5 TRANSFORMACIONES LINEALES 36
2.6 TRABAJO PRACTICO 38
2.7 COMPLEMENTO PARA EL USO DE EXCEL 44
ESTADÍSTICA DESCRIPTIVA 11
2 ESTADISTICA DESCRIPTIVA
Una vez fijado el objetivo de estudio y en consecuencia definida la o las poblaciones asociadas,
se procede a la recolección de los datos (censo o muestra).
Considerando que el conjunto de datos constituye una muestra, en este capítulo se estudian
algunas de las técnicas más usadas para:
• la presentación de los mismos en forma ordenada ( tablas y gráficos)

• el cálculo de medidas resúmenes.
Antes de analizar los datos es importante determinar primero si se recogieron datos cualitativos
o cuantitativos ya que se usan técnicas estadísticas distintas para cada uno de ellos, por lo que
se pueden esperar resultados erróneos si se aplica una técnica inapropiada.
2.1 DISTRIBUCIONES DE FRECUENCIAS Y GRAFICOS
Una forma útil de presentar un conjunto de datos es la distribución de frecuencias.
2.1.1 DATOS CORRESPONDIENTES A UN ATRIBUTO
Ejemplo :
Los siguientes datos representan la condición en Matemática Discreta de los alumnos de la ca-
rrera de Ingeniería en Sistemas de Información de la U.T.N., Reg. Rosario, inscriptos en la
asignatura Probabilidad y Estadística, en el año 2002
Número de alumnos Proporción de alumnos

Condición nk fk
Aprobada 119 0,24
Regular 320 0,64
Cursada 13 0,03
Cursando 44 0,09
Sin cursar 3 0
Totales 499 1,00
Característica en estudio: Condición en Matemática Discreta (variable cualitativa o atributo)
Para armar la distribución de frecuencias se particionó al conjunto de los 499 alumnos

inscriptos en Probabilidad y Estadística en el año 2002 en subconjuntos o clases según los
niveles del atributo (en el ejemplo 5 niveles que se corresponden con las condiciones de:
aprobada, regular, cursada, cursando y sin cursar).
El número de elementos que pertenecen a cada clase recibe el nombre de frecuencia
absoluta (nk).
El cociente entre la frecuencia absoluta y el número total de observaciones recibe el nombre de
frecuencia relativa ( fk ).
La suma de las frecuencias absolutas es igual al número total de observaciones y en conse-
cuencia, la suma de las frecuencias relativas es siempre igual a 1.
Es muy frecuente expresar a las frecuencias relativas como porcentaje; así en el ejemplo
diremos que sólo el 24 % de los alumnos que cursaron Probabilidad y Estadística en el 2002,
tenían aprobada la asignatura Matemática Discreta.
REPRESENTACION GRAFICA
 GRAFICO CIRCULAR O SECTORES (realizado en Excel, con asistente de gráfico )
Condición en Matemática Discreta de los alumnos

que cursan Prob. y Estadística - año 2002
Sin cursar
Cursando
0%
9%
Aprobada
Cursada
24%
3%
Regular
64%
 GRAFICO DE BARRAS (realizado en Excel con asistente de gráfico)
Condición en Matemática Discreta de los alumnos

inscriptos en Probabilidad y Estadística - 2002
0,70
0,60
0,50
frec. relativa
0,40
0,30
0,20
0,10
0,00
Aprobada Regular Cursada Cursando Sin cursar
Condición
 DIAGRAMA DE PARETO
Es un caso especial del diagrama de barras, que se usa con frecuencia en control de calidad.
Las barras se grafican en orden descendente. Puede también incluir una segunda escala (del
0 al 100), encima de las barras de las clases, que muestre los porcentajes acumulados.
Este tipo de diagrama lleva el nombre del economista italiano V. Pareto y en general
representa la “ ley de Pareto”, esto es: la mayor parte de los defectos aparece sólo en unas
pocas categorías.
Ejemplo :
Un analista de redes registró las causas principales que propiciaron fallas en los sistemas
durante los últimos seis meses, obteniendo el siguiente resultado:
Razón de la falla Frecuencia

Conexión física 1
Falla eléctrica 8
Software del servidor 28
Hardware del servidor 4
Servidor sin memoria disponible 14
Ancho de banda inadecuado 1
Este resultado se presenta en un diagrama de Pareto (obtenido a través del software

estadístico SPSS)
Razón de la falla
60
Percent
100
50
40
30
50
28
20
14
10
Count
8
0 4 0
Soft servidor Falla eléctrica Ancho de banda
Sin memoria Hardware Conexión física
2.1.2 DATOS CORRESPONDIENTES A UNA VARIABLE DISCRETA
Ejemplo :
Un distribuidor de aspiradoras registra el número de unidades vendidas por día durante un
período de 50 días. Los resultados obtenidos fueron:
84 88 87 89 88 89 88 91 87 85
88 89 90 88 87 91 86 89 85 88
86 90 89 84 91 92 89 88 94 90
87 89 91 86 90 89 91 92 89 88
85 88 87 88 91 87 92 90 85 87
Característica en estudio: número de aspiradoras vendidas por día (variable discreta)
A fin de ordenar la información se particiona al conjunto de 50 días en clases, según la variable

en estudio: número de aspiradoras vendidas por día y se realiza el cómputo de frecuencias
según se indica en la siguiente:
 DISTRIBUCION DE FRECUENCIAS
Frecuencia Frecuencia
Valor de la Frecuencia Frecuencia
Cómputo de absoluta relativa
variable absoluta relativa
Frecuencias acumulada acumulada
xk nk fk Nk Fk
84 // 2 0,04 2 0,04
85 //// 4 0,08 6 0,12
86 /// 3 0,06 9 0,18
87 //// // 7 0,14 16 0,32
88 //// //// 10 0,20 26 0,52
89 //// //// 9 0,18 35 0,70
90 //// 5 0,10 40 0,80
91 //// / 6 0,12 46 0,92
92 /// 3 0,06 49 0,98
93 0 0,00 49 0,98
94 / 1 0,02 50 1,00
Total 50 1,00
La frecuencia absoluta acumulada ( Nk ) es la cantidad de elementos correspondientes a

valores de la variable menores o iguales a xk .
La frecuencia relativa acumulada ( Fk ) es la proporción de elementos cuyo valor de la

variable es menor o igual que xk.
 GRAFICO DE BASTONES (realizado en Excel con Análisis de datos1)
El mismo se obtiene representando la frecuencia (absoluta o relativa) correspondiente a cada

valor de la variable mediante un segmento cuya longitud es proporcional a la frecuencia.
0,25
0,2
frecuencia relativa
0,15
0,1
0,05
0
83 84 85 86 87 88 89 90 91 92 93 94
número de aspiradoras
 GRAFICO ESCALONADO
0,8
Frec. rel. acumulada
0,6
0,4
0,2
0
83 84 85 86 87 88 89 90 91 92 93 94 95
Número de aspiradoras
1
Ver pasos a seguir para su utilización en el punto 2.7: Complemento para el uso de Excel, pag 45.
Si el número de observaciones hubiese sido pequeño (supongamos las dos primeras

columnas), el tratamiento de la información se haría a través de un:
 DIAGRAMA DE PUNTOS
•
• •
• • • • • • •
84 85 86 87 88 89 90 91
número de aspiradoras
2.1.3 DATOS CORRESPONDIENTES A UNA VARIABLE CONTINUA
Ejemplo:
Con el propósito de adecuar los objetivos curriculares de una escuela, se decide analizar la
realidad socioeconómica de la familia a la cual pertenecen los alumnos ingresantes en un
año determinado. A tal fin se registran para cada uno de ellos (entre otros datos) la superfi-
cie cubierta de la vivienda que habita la familia del alumno ingresante. Los resultados obteni-
dos para 30 alumnos ingresantes seleccionados al azar fueron:
85 - 117 - 92 - 120 - 94 - 110 - 151 - 90 - 80 - 116 - 95 - 102 - 100 - 113 - 118 - 140 - 133 -
108 - 115 - 148 - 110 - 130 - 100 - 120 - 108 - 125 - 105 - 130 - 112 - 150
Característica en estudio: superficie cubierta de la vivienda, en m2 (variable continua).
 DIAGRAMA DE TALLO-HOJA
Como un paso previo a la construcción de la distribución de frecuencias, los datos pueden

organizarse en un diagrama de tallo-hoja. En este tipo de diagramas, cada valor observado
se descompone en “dígitos tallo” y “dígitos hoja”.
En el ejemplo planteado, la decena y la centena de cada valor observado forman los “dígitos
tallo” y la unidad el “dígito hoja”.
dígitos tallo dígitos hoja
Así, para las dos primeras observaciones (85 y 117) re-
sultan: 8 5
11 7
Es conveniente presentar a los dígitos hoja ordenados en forma creciente para facilitar la
posterior utilización del diagrama tallo-hoja, tanto en forma gráfica como tabular.
En el ejemplo, resulta el diagrama de tallo-hoja realizado con PHStat 2 :
8 05
9 0245
10 002588
11 00235678
12 005
13 003
14 08
15 01
 DISTRIBUCION DE FRECUENCIAS
Otra forma de organizar la información es individualizando entre los datos, el valor mínimo (80
m2) y el máximo (151 m2) que asume la variable.
La diferencia entre ambos valores (en este caso 71 m2) se llama rango.
Los 28 valores restantes pertenecen al intervalo [ 80, 151].
Para poder realizar el respectivo cómputo de frecuencias, dicho intervalo se particiona en
subintervalos de igual amplitud. Cada uno de ellos identifica a una clase y recibe el nombre de
intervalo de clase .
Cuando se agrupan datos a través de intervalos de clase, se produce una pérdida de
información por la no conservación de los valores individuales. Demasiados intervalos provoca
pérdida de efectividad como medio de resumir datos; en cambio, pocos intervalos condensan
tanto la información que arrojan poca luz sobre el comportamiento de la característica.
La elección del número de subintervalos está estrechamente relacionada con la cantidad de
datos que se consideran. Es común usar entre 5 y 20 subintervalos.
Suele aplicarse una regla práctica que indica que el número de subintervalos es
aproximadamente igual a la raíz cuadrada del número de observaciones.
Para el ejemplo dado, se tomarán 6 subintervalos, dado que 30 = 5,4772
Cuando se fijan los intervalos de clase, se debe tener en cuenta que:
 Deben ser semiabiertos para que cada valor de la variable pertenezca a uno y sólo
uno de los intervalos.
En el ejemplo : 79 < x ≤ 91 ó ( 79 , 91]
 El punto medio de cada intervalo de clase debe ser un posible valor de la variable (de
acuerdo a las restricciones con las que se expresan los valores de las observaciones).
En el ejemplo los puntos medios deben ser valores enteros a pesar de que la variable
es continua.
Es preferible, por facilidad en el análisis, que los intervalos posean igual amplitud.
La tabla siguiente muestra la distribución de frecuencias del ejemplo :
2
PHStat es un complemento estadístico para Microsoft Excel incluido en el CD que acompaña al libro Estadística para Adminis-
tración (2da edición) de Berenson, M; Levine , D. y Krehbiel,T.; editorial Pearson Educación, México, 2001.
Intervalo de clase Punto medio absoluta relativa
absoluta relativa
acumulada acumulada
79 < x ≤ 91 85 3 0,10 3 0,10
91 < x ≤ 103 97 6 0,20 9 0,30
103 < x ≤ 115 109 8 0,27 17 0,57
115 < x ≤ 127 121 6 0,20 23 0,77
127 < x ≤ 139 133 3 0,10 26 0,87
139 < x ≤ 151 145 4 0,13 30 1,00
30 1,00
 HISTOGRAMA
• Las bases de las barras tienen la longitud igual a la amplitud del intervalo de clase que
representan y se ubican sobre el eje de la abscisa.
• El área de cada barra es proporcional a la frecuencia del intervalo de clase.
• Si los intervalos de clase son de igual amplitud, las alturas de las barras resultan
proporcionales a las frecuencias de las clases. En caso de amplitudes diferentes, las
alturas deben ser calculadas para que se verifique la condición anterior.
Para el ejemplo, se presenta a continuación la distribución de frecuencia y el histograma

realizado en Excel con Análisis de datos:3
Clases Frecuencia Frec. acumulada

79 0 0
91 0,10 0,10
103 0,20 0,30
115 0,27 0,57
127 0,20 0,77
139 0,10 0,87
151 0,13 1
163 0 1
3
Ver pasos a seguir para su utilización en el punto 2.7: Complemento para el uso de Excel, pag 45
0,3
0,25
0,2
Frecuencia
0,15
0,1
0,05
0
79 91 103 115 127 139 151 163
Superficie cubierta (en m2)
Los histogramas son más fáciles de interpretar si los intervalos de clase tienen la misma
amplitud.
El histograma, al igual que el diagrama de tallo-hoja, proporciona una impresión visual del
aspecto que tiene la distribución de las observaciones, así como información sobre la
dispersión de los datos.
Al pasar de los datos originales o del diagrama de tallo-hoja a la distribución de frecuencias y al
histograma, se pierde parte de la información debido a que ya no se tienen las observaciones
originales. Sin embargo, esta pérdida en la información a menudo es pequeña si se le compara
con la facilidad de interpretación ganada al utilizar la distribución de frecuencias y el
histograma.
Para conjuntos de datos pequeños, los histogramas pueden cambiar claramente de apariencia
si el número de clases o el ancho de éstas cambia. Los histogramas son más estables si el
número de observaciones es grande.
 POLIGONO DE FRECUENCIAS
Otra forma de representar gráficamente la distribución de frecuencias absolutas o relativas es a

través del polígono de frecuencias.
Si se considera una distribución de frecuencias con intervalos de clase de igual amplitud, el
polígono está referido a un sistema coordenado donde cada vértice tiene por abscisa el punto
medio del intervalo y por ordenada la frecuencia del intervalo de clase.
Para hallar los puntos de iniciación y finalización del polígono, se consideran dos intervalos
de clase (uno anterior al primero y otro posterior al último) de igual amplitud a los restantes y de
frecuencia cero.
Se demuestra mediante la igualdad de triángulos que el polígono así construido encierra igual
área que el histograma.
Para el ejemplo:
0,3
0,25
frecuencia relativa
0,2
0,15
0,1
0,05
0
73 85 97 109 121 133 145 157
sup. cubierta (en m2)
 POLIGONO DE FRECUENCIAS ACUMULADAS
De igual forma se puede construir el polígono de frecuencias acumuladas como se muestra en

la siguiente figura:
1
0,9
Frec. relativa acumulada
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
67 79 91 103 115 127 139 151 163
Sup. cubierta (en m2)
4
Se presenta a continuación otro ejemplo sobre variable continua :
4
Ejemplo extraído de “Probabilidad y Estadística aplicada a la Ingeniería” de Montgomery Douglas, Runger Geor-
ge.- Mc Graw Hill – México, 1996. pag. 5
Los datos de la siguiente tabla representan la resistencia a la tensión, en libras por pulgada
cuadrada (psi), de 80 muestras de una nueva aleación de aluminio y litio, que está siendo
evaluada como posible material para la fabricación de elementos estructurales de aeronaves.
Resistencia a la tensión de 80 muestras de aleación de aluminio-litio

105 221 183 186 121 181 180 143
97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
Los datos fueron registrados conforme se realizaba la prueba y en este formato no conllevan
mucha información con respecto a la resistencia a la tensión. No es fácil responder a preguntas
tales como “¿Qué porcentaje de las muestras fallaron debajo de los 120 psi?”.
Dado que se tienen muchas observaciones, la construcción de un diagrama de puntos para
estos datos es ineficiente; existen presentaciones visuales más eficaces para conjuntos
grandes de datos. Una de ellas es el ya visto diagrama de tallo y hoja:
Tallo Hoja Frecuencia

7 6 1
8 7 1
9 7 1
10 51 2
11 580 3
12 103 3
13 413535 6
14 29583169 8
15 471340886808 12
16 3073050879 10
17 8544162106 10
18 0361410 7
19 960934 6
20 7108 4
21 8 1
22 189 3
23 7 1
24 5 1
Otra gráfica apropiada es el histograma. Nótese en la figura siguiente la simetría de la

distribución de frecuencias de las mediciones de resistencia.
2.1.4 GRAFICAS DE SERIE DE TIEMPO 5
Las gráficas consideradas hasta el momento (histogramas, diagramas de tallo y hoja) son
métodos visuales muy útiles para mostrar la variabilidad presente en los datos. Sin embargo,
con frecuencia el tiempo es un factor importante que contribuye a la variabilidad observada en
los datos, y los métodos anteriores no lo toman en cuenta. Una serie de tiempo, o secuencia de
tiempo, es un conjunto de datos en los que las observaciones se registran en el orden en que
ocurren. La gráfica de una serie de tiempo es un diagrama en el que el eje vertical denota el
valor observado (por ejemplo x), mientras que el eje horizontal denota el tiempo (que puede ser
minutos, días, años, etc.). Cuando se grafican las mediciones como una serie de tiempo, a
menudo se observan tendencias, ciclos u otras características importantes de los datos que, de
otra forma, pasarían inadvertidas.
Por ejemplo, considérese la figura 1-18 a, la cual presenta la gráfica de una serie de tiempo de
las ventas anuales de una compañía durante los últimos diez años. La impresión general que
ofrece esta gráfica es que las ventas tienen una tendencia a crecer. Existe cierta variabilidad
en esta tendencia, donde, las ventas en algunos años aumentaron con respecto a las del año
anterior, mientras que las ventas de otros años disminuyeron. La figura 1-18 b presenta las
ventas de los tres últimos años notificadas por trimestre. Esta gráfica muestra de manera clara
que las ventas anuales de la empresa exhiben una variabilidad cíclica por trimestre, donde las
ventas en los dos primeros trimestres son mayores que en los dos últimos.
5
Extraído de “Probabilidad y Estadística aplicada a la Ingeniería” de Montgomery Douglas, Runger George.- Mc
Graw Hill – México, 1996. pag. 33
a)
b)
Figura 1-18 Ventas de una compañía por año a) y por trimestre b)
Algunas veces puede ser útil combinar las gráficas de serie de tiempo con alguno de los tipos
de presentación gráfica considerados hasta el momento, por ejemplo con los diagramas de ta-
llo y hoja, para formar un diagrama de dígitos y líneas.
La figura 1.19 presenta un diagrama de dígitos y líneas para las observaciones de resistencia
a la tensión del ejemplo de la página 23, que como se dijo, fueron registradas en el orden en
que ocurrieron.
Esta gráfica indica de manera eficaz la variabilidad total de los datos de resistencia a la tensión
y, de manera simultánea, presenta la variabilidad en las mediciones con el paso del tiempo. La
impresión general es que la resistencia cambia alrededor del valor medio de 162,67, y no hay
ningún patrón obvio sobre esta variabilidad con respecto al tiempo.
El diagrama de dígitos y líneas de la figura 1.20 presenta una situación diferente. Esta gráfica
resume 30 observaciones sobre la concentración de un producto obtenido mediante un proceso
químico, donde las observaciones se registraron a intervalos de una hora. La gráfica indica
que, durante las primeras 20 horas de operación, el proceso produjo concentraciones en
general por encima de 85 g/l, pero después de la muestra 20 algo ocurrió con el proceso, que
dio como resultado concentraciones más bajas. Si esta variabilidad en la concentración del
producto puede reducirse, entonces es posible mejorar la operación del proceso.
2.2 MEDIDAS CARACTERISTICAS DE UNA DISTRIBUCION DE

FRECUENCIAS.
Las medidas que resumen la información de una distribución de frecuencias reciben el nombre
de:
ESTADISTICOS
de acuerdo a
la información que brindan
pueden ser de
POSICION DISPERSION
Media
Media Mediana Moda Fractilas Rango Varianza Desvío Desvío Inter-
estándar cuartílico
2.2.1 MEDIDAS DE POSICION
Se llaman también de tendencia central y están referidas a la posición de la distribución de

frecuencias sobre el eje de las abscisas.
Ellas son :
NOMBRE NOTACION DEFINICION
Media aritmética x Es el promedio de las observaciones
Es el valor de la variable con mayor

Moda x̂ frecuencia
Es el mínimo valor de la variable que

Mediana ~
x
acumula, por lo menos, el 50 % de las
observaciones ordenadas en forma
creciente
Son los mínimos valores de la variable que

acumulan respectivamente, por lo menos :
Cuartiles q1 q2 q3
d1 d2 ...... d9 el 25% , el 50% y el 75% de las observa-
p1 p2 ........p99 ciones ordenadas en forma creciente.
Fractilas Deciles
el 10% , el 20% ........el 90% de las obser-
vaciones ordenadas en forma creciente.
Percentiles
el 1% , el 2% ........ el 99% de las obser-
vaciones ordenadas en forma creciente.
 Media aritmética o promedio muestral
Es la más conocida y utilizada de las medidas de posición.

No coincide necesariamente con un valor de la variable.
Para el cálculo del promedio de n observaciones de la variable X ( xi con i = 1, 2,.......n ),
resulta:
n
1
x=
n
∑
i= 1
xi (1)
Si las n observaciones están agrupadas en r clases , la fórmula (1) resulta :
r r
1
x=
n
∑
i= 1
xi ni = ∑
i= 1
xi fi (2)
• En los casos en que las observaciones se encuentren agrupadas en intervalos de clase,

se le da a xi el valor del punto medio del intervalo de clase correspondiente.
Características del promedio:
• Toma en consideración toda la información por lo tanto es muy sensible a la influencia

de los valores extremos, lo que puede ser una ventaja o desventaja, según la situación.
• Es una medida de posición útil para comparar dos o más distribuciones, sólo si éstas
tienen forma semejante.
 Moda
Es el valor de la variable con mayor frecuencia.
Características de la moda:
• Algunos conjuntos de observaciones no poseen moda.
• Algunos conjuntos de observaciones tienen más de una moda.
 Mediana
Es el mínimo valor de la variable que acumula, por lo menos, el 50 % de las observaciones

ordenadas en forma creciente, por tal razón es uno de los llamados estadísticos de orden.
~
x / F (~
x ) ≥ 0,5
Característica de la mediana:
• Al no tomar en cuenta toda la información pues depende de la cantidad de observaciones y no de

la magnitud de ningún valor extremo, no es sensible a dichos valores extremos.
 Fractilas
Se trabajan en forma similar a la mediana.
 Ejercicios
1. Indique cómo calcularía la mediana en los siguientes casos :
 si se tiene un número impar de observaciones, por ej. : 7 , 12 , 15 , 10 , 4
 si se tiene un número par de observaciones, por ej. : 4 , 17 , 15 , 10 , 12 , 7
 si las observaciones se encuentran clasificadas en clases (ej. apartado 2.1.2, pag. 16)
 si las observaciones se encuentran agrupadas en intervalos de clase (ej. apartado

2.1.3 , pag. 20 )
2. Los últimos diez días de junio, el tren “ Costa Especial ” llegó tarde a su destino en los
siguientes números de minutos ( un número negativo significa que el tren llegó con anti-
cipación):
3 , 6 , 4 , 10 , - 4 , 124 , 2 , - 1 , 4 , 1
¿Qué medidas de posición utilizaría Ud. para :
 mostrar que el tren ofrece un buen servicio?

 mostrar que el tren ofrece un mal servicio?
 COMPARACION DE MEDIA ARITMETICA, MEDIANA Y MODA
Distribución Sim étrica
Media
Mediana
Moda
Distribuciones Asimétricas o Sesgadas
Distribución asimétrica a la derecha
Distribución asimétrica a la izquierda
2.2.2 MEDIDAS DE DISPERSIÓN
Analizando comparativamente las siguientes distribuciones se observa que a pesar de que

están igualmente centradas, los valores de la variable de cada una de ellas están alejados del
promedio de manera distinta. Esta situación hace ver la necesidad del estudio de otro tipo de
medida característica de las distribuciones de frecuencias que son llamadas de dispersión.
Dicha información se obtiene a través de los siguientes estadísticos de dispersión:
NOMBRE NOTACION DEFINICION
Es la diferencia entre el mayor y

r el menor valor de las
Rango
observaciones
Es el promedio, aproximado, de
los cuadrados de las diferencias
Varianza muestral entre los valores de las observacio-
s2n-1
nes y su correspondiente media
aritmética
Es la raíz cuadrada positiva de la

Desvío estándar muestral s
varianza.
Recorrido intercuartílico Es la diferencia entre el cuartil 3

riq
y el cuartil 1.
 Rango
Es la diferencia entre el máximo valor de las observaciones (x M) y el mínimo valor de las

mismas (xm )
r = xM - x m
Proporciona una primera información sobre la dispersión de los valores pero basta que al
menos uno de los dos valores que intervienen en su cálculo esté excesivamente alejado
para que pierda importancia la información que brinda.
 Varianza muestral
Es el promedio, aproximado, de los cuadrados de los desvíos de las observaciones con res-
pecto a su media aritmética.
1 r
∑ ( xi − x ) ni
2
s n2− 1 =
n − 1 i= 1
Si el denominador hubiese sido n en lugar de n-1, se hubiera obtenido el promedio de los
cuadrados de los desvíos de las observaciones con respecto al promedio de las mismas. Sin
embargo, n-1 se usa aquí debido a ciertas propiedades deseables del estadístico s2 que lo
hacen apropiado para la inferencia estadística. Si el tamaño de la muestra es grande, la

diferencia entre s2n y s2n-1 es despreciable.
La varianza está expresada en unidades al cuadrado, lo que representa una desventaja para
su interpretación.
 Desvío estándar muestral
Es la raíz cuadrada positiva de la varianza muestral.
s = s n2− 1
Este estadístico tiene la ventaja de estar expresado en la misma unidad de las

observaciones
 Recorrido intercuartílico
Es la diferencia entre el tercer cuartil y el primer cuartil.
riq = q3 - q1
Se darán a continuación las medidas características calculadas para los dos ejemplos
trabajados con variable discreta y con variable continua. Las mismas fueron obtenidas en Excel
con Análisis de datos, en la opción Estadística Descriptiva :
Para el ejemplo del apartado 2.1.2 correspondiente al número de aspiradoras vendidas

diariamente por un distribuidor, las mismas resultaron :
Número de Aspiradoras
Media 88,44
Error típico 0,32
Mediana 88,00
Moda 88,00
Desviación estándar 2,23
Varianza de la muestra 4,99
Curtosis -0,22
Coeficiente de asimetría 0,05
Rango 10
Mínimo 84
Máximo 94
Suma 4422
Cuenta 50
Con respecto al ejemplo del apartado 2.1.3 correspondiente a la superficie cubierta de las
viviendas de los alumnos ingresantes a una escuela las mismas resultaron :
Superficie cubierta (en m2)

Media 113,90
Error típico 3,41
Mediana 112,50
Moda 120,00
Desviación estándar 18,70
Varianza de la muestra 349,54
Curtosis -0,33
Coeficiente de asimetría 0,35
Rango 71
Mínimo 80
Máximo 151
Suma 3417
Cuenta 30
2.2.3 COEFICIENTE DE VARIACION
Es una medida de variación relativa. Se simboliza c.v. y es igual a :
s
c.v. = . 100
x
Es el desvío estándar expresado como porcentaje de la media aritmética, por lo tanto no viene
expresado en unidades.
Es útil para la comparación de la variabilidad relativa entre distribuciones que no están
expresadas en la misma unidad de medida o bien, entre distribuciones que si bien están
expresadas en la misma unidad, poseen promedios muy dispares.
Ejemplo :
En febrero del año pasado, los datos de préstamos personales de una mutual mostraron
un promedio de $650 y una desviación estándar de $300. Recientemente se calculó la
media y la desviación estándar correspondiente a los préstamos personales de febrero
del presente año resultando las mismas $ 900 y $ 350 respectivamente.
¿En cuál de los dos años los préstamos personales presentaron menor dispersión
relativa?
c.v. año pasado = ( 300 / 650 ) . 100 = 45%
c.v. presente año = ( 350 / 900 ) . 100 = 39%
La menor dispersión relativa se presenta en los préstamos personales otorgados este

año por la mutual.
2.3 REGLA EMPIRICA
Es posible que dos conjuntos de datos distintos tengan el mismo rango pero difieran
considerablemente en el grado de variación de los datos. En consecuencia, el rango es una
medida relativamente insensible de la variación de los datos. La varianza tiene importancia
teórica, pero es difícil de interpretar porque las unidades de medición de la variable de interés
están elevadas al cuadrado. En cambio, las unidades de medición de la desviación estándar
son las unidades de la variable. Si la desviación estándar se combina con la media del conjunto
de datos, resulta fácil interpretarla. Una regla práctica útil es la que se conoce como regla
empírica, a saber:
Si un conjunto de datos tiene una distribución aproximadamente simétrica se pueden utilizar

las siguientes reglas prácticas para describir el conjunto de datos:
 Aproximadamente el 68 % de las observaciones quedan a una desviación estándar de su

media (es decir, dentro del intervalo x ± s )
 Aproximadamente el 95 % de las observaciones quedan a dos desviaciones estándar de su

media (es decir, dentro del intervalo x ± 2 s )
 Casi todas las observaciones quedan a tres desviaciones estándar de su media (es decir,
dentro del intervalo x ± 3 s )
La regla empírica es el resultado de la experiencia práctica de investigadores en muchas

disciplinas, que han observado muy diferentes tipos de conjuntos de datos de la vida real.
Fuente : Estadística Elemental. Johnson – Kuby pag 82
Con respecto al ejemplo del apartado 2.1.3 correspondiente a la superficie cubierta de las
viviendas de los alumnos ingresantes a una escuela, la media es 113,8 m2 y la desviación
estándar 18,267 m2.
Las proporciones del número total de observaciones que se esperaría encontrar en
los intervalos x ± s , x ± 2 s y x ± 3 s según la regla empírica, así como las
proporciones reales, se presentan en la siguiente tabla:
Proporción esperada de Proporción real de

k x ± ks observaciones en el observaciones en el
intervalo intervalo
1 95,533 – 132,067 0,68 0,67
2 77,266 – 150,334 0,95 1,00
3 58,999 – 168,601 Aproximadamente 1,00 1,00
En caso de conocer la distribución de frecuencias, lógicamente se encuentran las proporciones

reales de las observaciones para los distintos intervalos y no se aplica la regla empírica.
2.4 DIAGRAMAS DE CAJA O BOX - PLOT
Representa los tres cuartiles junto con los dos valores extremos de las observaciones.
Los diagramas de caja que se presentan a continuación ( confeccionados con PHStat ),
corresponden a los datos observados para las características “número de aspiradoras
vendidas” y “superficie cubierta de la vivienda” analizadas anteriormente en el desarrollo de las
distribuciones de frecuencias de las variables discretas y continuas, respectivamente.
Nº Aspiradoras
96
94
92
90
88
86
84 Nº Aspiradoras
82
Superficie cubierta
150
130
110
90
Superficie
70
El lado inferior de las cajas corresponde al primer cuartil, el lado superior al tercer cuartil y el
segmento que divide a las cajas al segundo cuartil. Un segmento de recta une el lado inferior
de las cajas con el mínimo valor observado y otro segmento une el lado superior de las cajas
con el máximo valor observado.
Constituyen una herramienta eficaz para el análisis de la simetría de una distribución de

frecuencias y su estudio comparativo con otras distribuciones.
• DETECCION DE VALORES ANOMALOS (outliers)
Hay ocasiones en que un conjunto de datos contiene observaciones inconsistentes y es proba-

ble que no se desee incluirlas para su análisis. Cuando dichas observaciones se salen del in-
tervalo de valores de datos que se quiere describir, se denominan valores anómalos u
outliers.
Una observación “x” que es inusualmente grande o pequeña en relación con los demás valores
de un conjunto de datos se denomina valor anómalo.
Uno de los métodos para determinar si una observación es un valor anómalo es observar si el
valor absoluto de z es anormalmente grande.
El valor “z” de un valor “x” de un conjunto de datos es la distancia a la que se encuentra x
por arriba o por debajo de la media, medida en unidades de la desviación estándar:
x -x
Valor z =
s
Estos valores por lo general son atribuibles a una de las siguientes causas:
 La observación se registra incorrectamente.

 La observación proviene de una población distinta.
 La observación es correcta pero representa un suceso poco común (fortuito)
2.5 TRANSFORMACIONES LINEALES
Supongamos una variable “x” con media aritmética ( x ) y varianza ( s2x ) y una variable “y”
de la forma:
y = a+bx
Se demuestra fácilmente que:
• y= a+ bx ( media aritmética de la variable y )
2 2 2
• sy = b sx ( varianza de la variable y )
• sy = b sx ( desvío estándar de la variable y )
En el caso b = 1, lo único que se hace es sumar una constante (a). La media aritmética de la
nueva variable quedará incrementada en un valor igual al de la constante (a) y el desvío
estándar, que es una medida de dispersión, permanece igual.
En cambio, si la variable es multiplicada por una constante b ≠ 1, esto produce una contracción
o una dilatación de la distribución (según sea b menor o mayor que 1) lo que se refleja en la
varianza.
Ejemplo :
Sea la variable x : número de días completos trabajados en un año por operario de una fá-
brica.
Se conoce que el promedio de la variable x es 290,1 días con una desviación de 2,2 días.
Cada día no trabajado ocasiona a la fábrica una pérdida de $ 150.
Calcule la pérdida anual promedio por operario y su desvío estándar (considere 300 días la-
borables en el año).
y : pérdida anual por operario
yi = ( 300 - xi ) 150
de donde :
y = ( 300 - 290,1 ) 150 = $ 1485 pérdida anual promedio por operario
sy = 150 . 2,2 = $ 330 desviación estándar de la pérdida anual por operario
2.6 TRABAJO PRACTICO
1.- Analice los siguientes gráficos6. Comente.
a ) El siguiente gráfico representa una reducción ( en el año 1990 con respecto al año
anterior ) del 50% en el número de barriles de petróleo extranjero utilizado en el proceso
de manufactura de productos de películas por una empresa.
120,000
Barriles
60,000
1989 1990
b)
Liderazgo
2% 2%
3%
COLDWELL BANKER
11%
E.R.A.
32% GALLERY
CENTURY
otros
¿Quién creen los propietarios que es el líder en bienes raíces?
6
Los gráficos fueron realizados por Diego Martínez Viademonte, alumno que cursó la asignatura en el año 2003
c)
Chevrolet. Los camiones más formales y de mayor duración.
Como una roca
98
Porcentaje
97
96
95
CHEVY FORD TOYOTA NISSAN
Camión
Más del 98% de los camiones Chevy vendidos durante los últimos 10 años siguen en el camino.
Chevrolet. Los camiones más formales y de mayor duración.
Como una roca
100
90
80
70
Porcentaje
60
50
40
30
20
10
0
CHEVY FORD TOYOTA NISSAN
Camión
Más del 98% de los camiones Chevy vendidos durante los últimos 10 años siguen en el camino.
2.- En una editorial se clasificaron las publicaciones del año anterior según su carácter y se
obtuvo que el 45% de las publicaciones eran científicas, el 17% técnicas, 16% literarias,
12% artísticas y 10% de otro carácter.
Presente un informe respecto a las publicaciones de la editorial.
3.- Una fábrica de estéreos desea estudiar la relación entre el número de piezas defectuosas y
el momento de la jornada de trabajo en que se producen las mismas. Se fijaron tres
períodos de la jornada : 6 – 7 horas ; 10 – 11 horas y 13 – 14 horas y en cada uno de ellos
se observó durante treinta días el número de defectuosos. Los resultados obtenidos fueron:
4 1 4 3 5 10 4 8 10 3 7 6 6 5 9
1° período
8 10 6 4 6 5 7 6 6 9 7 5 6 7 5
6 2 4 5 7 8 5 6 4 6 5 7 4 6 5
2° período
3 6 6 5 9 8 6 7 6 4 7 6 6 5 7
4 5 6 9 8 10 12 11 12 10 9 9 10 8 7
3° período
11 12 9 14 12 9 11 13 12 11 13 14 12 10 13
Compare y concluya respecto de la relación entre el número de piezas defectuosas y el

momento de la jornada de trabajo.
4.- Los siguientes datos corresponden a los tiempos de duración (en segundos) de 100 temas
de rock. Realiza un análisis descriptivo completo de la información:
Tiempo Frecuencia
135 ≤ t < 145 8
145 ≤ t < 155 9
155 ≤ t < 165 18
165 ≤ t < 175 20
175 ≤ t < 185 35
185 ≤ t < 195 10
5.- A los efectos de organizar las compras de gaseosas para la fiesta de fin de curso de un
instituto, se le preguntó a cada uno de los 200 integrantes de la comunidad educativa la
gaseosa preferida.
Completa la siguiente tabla a doble entrada considerando que:
♦ el 20 % de los docentes y el 30 % de los alumnos prefieren naranja
♦ de los no docentes , el 40 % prefieren cola y el 20 % prefieren pomelo
♦ el porcentaje de alumnos que prefieren pomelo es igual al de los docentes que prefieren
la misma gaseosa
Integrante
s
Docentes No docentes Alumnos Totales
Gaseosa
Cola
Pomelo 4
Naranja
Totales 40 10
6.- Una compañía de seguros registró entre sus asegurados el número de accidentes del año
2003, obteniendo la siguiente información:
Edad del asegurado

[18-28) [28-38) [38-48) [48-58) 58 y más Totales
N° de accidentes
0 748 821 786 720 672
1 84 50 41 66 60
2 41 15 12 16 25
más de 2 10 9 5 5 8
Totales
En base al cuadro anterior responde:
a) ¿Qué porcentaje de asegurados no tuvo accidentes durante 2003?

b) Analiza en qué rango de edades hay el mayor y el menor porcentaje de asegurados
que tuvieron al menos un accidente.
c) Si la compañía decide no renovar el seguro a todos aquellos asegurados que hayan
tenido más de dos accidentes, ¿cuántos asegurados están en condiciones de renovar
su seguro en 2004?
d) ¿Cuál puede haber sido el objetivo de este estudio?
e) La compañía decide dar un premio del 5% de descuento sobre el valor de la póliza del
año 2004 a todos aquellos asegurados que no sufrieron accidentes en 2003. El valor
promedio de cada póliza es de $ 3.200, ¿cuánto dejará de ganar la compañía en 2004
por la implementación de dicho premio?
7.- La siguiente es la distribución de frecuencias de los sueldos de los empleados

administrativos de una industria:
Sueldo ( x ) ( en $ ) Número de empleados
200 < x ≤ 400 10

400 < x ≤ 600 25
600 < x ≤ 800 40
800 < x ≤ 1000 10
1000 < x ≤ 1200 2
a) Calcule las medidas descriptivas que crea conveniente para representar los datos e
interprete sus resultados.
b) El sueldo promedio de los 1000 operarios de esa industria es de $ 490. Obtenga el
sueldo promedio para el conjunto de ambas categorías de empleados.
c) Si conociera la mediana y la moda para la categoría de los operarios, ¿podría calcular
esas medidas para el conjunto de todos los trabajadores de la industria?
d) Si se aumentara en un 10 % el sueldo de cada empleado, calcule sueldo promedio y
varianza.
e) Si a cada empleado se le aumenta el sueldo en 50 $, calcule sueldo promedio y varian-
za.
8.- Los siguientes datos son mediciones de viscosidad de un producto químico tomadas cada
hora (de arriba abajo y de izquierda a derecha).
47,9 48,8 48,6 43,2 43,0

47,9 48,1 48,0 43,0 42,8
48,6 48,3 47,9 43,5 43,1
48,0 47,2 48,3 43,1 43,2
48,4 48,9 48,5 43,0 43,6
48,1 48,6 48,1 42,9 43,2
48,0 48,0 48,0 43,6 43,5
48,6 47,5 48,3 43,3 43,0
a) Grafique de la manera más conveniente.
b) Las especificaciones sobre la viscosidad del producto son 48 + 2. ¿Qué conclusiones

puede obtener sobre el desempeño del proceso?
9.- En un proceso de producción interesa controlar el diámetro ( X ) de un tipo de lata ( en mm ).
Se seleccionan al azar 160 latas a las cuáles se les mide el diámetro y se obtiene la
siguiente distribución de frecuencias:
Diámetro de las latas Cantidad de latas

83,4 ≤ x < 83,5 3
83,5 ≤ x < 83,6 12
83,6 ≤ x < 83,7 21
83,7 ≤ x < 83,8 30
83,8 ≤ x < 83,9 47
83,9 ≤ x < 84,0 28
84,0 ≤ x < 84,1 19
a) Indique la característica en estudio y clasifíquela. Dé la unidad elemental asociada a la

variable o atributo. Grafique.
b) Calcule la media aritmética, mediana, moda , desvío estándar. Analice la simetría.
c) De otra muestra de 200 observaciones del diámetro de la lata mencionada se obtuvo
un promedio de 83,93 mm con una desviación estándar de 0,20 mm. ¿Puede a partir
de estos datos encontrar el promedio de las observaciones de las dos muestras? En
caso afirmativo, encuéntrelo. En caso negativo, justifique porqué.
d) ¿Cuál de la dos muestras (la primera de 160 observaciones y la segunda de 200
observaciones) presenta menor dispersión relativa? Justifique la respuesta.
10.- Para comparar la capacidad de frenado de tres diseños de bandas de rodamiento, se

midió la distancia necesaria para detener un tipo de automóvil que se desplazaba sobre
pavimento húmedo. Los neumáticos de cada diseño fueron probados en el mismo
vehículo que circulaba sobre un pavimento húmedo controlado.
Diseño A Diseño B Diseño C

37 – 36 – 34 – 40 – 38 - 32 33 – 34 – 35 – 38 – 42 - 34 40 – 39 – 41 – 41 – 40 - 43
Construya un gráfico de cajas para cada uno de los tres diseños y presente un informe
con sus conclusiones.
2.7 COMPLEMENTO PARA EL USO DE EXCEL
1. Se entra en Excel en HERRAMIENTAS
2. En COMPLEMENTOS DISPONIBLES se activan las opciones Herramientas para

análisis y Herramientas para análisis VBA
3. Se activa ANALISIS DE DATOS ( ahora ya en Herramientas )
4. Para graficar se entra a la opción HISTOGRAMA

a) Rango entrada : se marca la columna en donde están los datos
b) Rango de clase : se marca la columna en donde se han dado los límites superiores de
los intervalos de clase elegidos
c) Rango de salida : se elige dónde se quieren la distribución de frecuencias y el gráfico
( puede ser en la misma hoja o en hoja nueva )
d) Se activa crear gráfico
e) Para los dos tipos de gráficos (bastones e histograma) se activa una barra.
En OPCIONES: ANCHO DE RANGO:
- Si se lleva a 500 las barras se separan y se obtiene el gráfico de BASTONES
- Si se lleva a 0 las barras se unen y se obtiene el HISTOGRAMA
5.- En ANALISIS DE DATOS la opción ESTADÍSTICA DESCRIPTIVA da el resumen de

todos los estadísticos (posición, dispersión, asimetría etc.)
3.
PROBABILIDAD
CONTENIDO
3 PROBABILIDAD................... 46
3.1 INTRODUCCION.........................................................46
3.2 LENGUAJE DE LA PROBABILIDAD...................... 46
3.3 DEFINICIONES DE PROBABILIDAD...................... 48

3.3.1 DEFINICION FRECUENCIAL DE PROBABILIDAD.............................. 48
3.3.2 DEFINICION CLASICA DE PROBABILIDAD O DE LAPLACE........... 50
3.3.3 PROBABILIDAD SUBJETIVA.................................................................... 51
3.4 PROPIEDADES DE LA PROBABILIDAD............ 51
3.5 REGLAS DE LA PROBABILIDAD........................ 51

3.5.1 PROBABILIDAD SIMPLE (o MARGINAL).......................................... 52
3.5.2 PROBABILIDAD CONJUNTA................................................................. 53

3.5.3 REGLA DE LA SUMA.................................................................................. 54
3.5.4 PROBABILIDAD CONDICIONAL............................................................. 55
3.5.5 INDEPENDENCIA ESTADÍSTICA............................................................. 56
3.5.6 REGLA DE LA MULTIPLICACIÓN....................................................... 57
3.5.7 TEOREMA DE LAS PROBABILIDADES TOTALES............................ 59
3.5.8 TEOREMA DE BAYES............................................................................... 60
3.6 TRABAJO PRÁCTICO................................................62

PROBABILIDAD 46
3 PROBABILIDAD
3.1 INTRODUCCION
Tal vez esté familiarizado con algunas ideas de probabilidad, ya que ésta forma parte de la
cultura cotidiana. Con frecuencia se escucha a personas que hacen afirmaciones relacionadas
con la probabilidad como las siguientes:
 Probablemente nuestro equipo gane esta noche.
 Hay un 40 % de probabilidad de que llueva mañana.
 Tengo una posibilidad de 50-50 de aprobar el examen de estadística de hoy.
 Es más probable que nos encontremos un fin de semana que un día de la semana.
¿Qué significan exactamente este tipo de expresiones? ¿Significan de hecho lo que afirman?.
Algunas afirmaciones pueden estar basadas en información científica y otras en prejuicios
subjetivos. Cualquiera que sea el caso, son inferencias probabilísticas: no hechos, sino
conjeturas.
Como ya se vio en el ejemplo de las elecciones de gobernador e intendente (capítulo 1, pag.
5), no se puede tener la certeza de que el porcentaje de votos obtenido por un candidato
cualquiera aparezca en una muestra aleatoria. Sin embargo, es “probable” que el porcentaje
en la muestra resulte “próximo” al que se obtuvo en el acto eleccionario.
Se tiene como propósito definir “probable”, “próximo”, de manera más precisa.
Para ello es necesario considerar en primer término una serie de nociones básicas sobre el
conocimiento de las “leyes de probabilidad”.
En este capítulo se estudiará el concepto básico de probabilidad y sus reglas aplicadas a
sucesos simples y sucesos compuestos.
La teoría de la probabilidad es la base de la inferencia estadística y un instrumento esencial
en el análisis de la variabilidad.
3.2 LENGUAJE DE LA PROBABILIDAD
 Experimento aleatorio
Es el tipo de fenómenos de que nos ocuparemos. Se caracterizan porque:
 aunque no se puede saber el resultado particular que ocurrirá, se puede describir el
conjunto de todos los resultados posibles
 después de un gran número de repeticiones de la experiencia aleatoria, existe una
distribución regular de los resultados. Es decir, a medida que el experimento se repite
los resultados parecen ocurrir de manera caprichosa, sin embargo, ante un gran
número de repeticiones aparece un modelo definido de regularidad. Esta regularidad
hace posible la construcción de un modelo matemático que permite el análisis del
experimento.
 Esto se puede visualizar en el ejemplo del lanzamiento de una moneda (ver punto.
3.3.1, pag. 49).
G.Carnevalli-E.Franchelli-G.Gervasoni
PROBABILIDAD 47
“Aleatorio” en estadística no significa de cualquier manera, sino que se refiere a una

clase de orden que únicamente aparece a largo plazo.
 Espacio muestral y sucesos
 En una experiencia aleatoria cada resultado se conoce con el nombre de suceso.

 Se llama suceso elemental a todo resultado simple. Por ejemplo, si se considera la
experiencia aleatoria de tirar un dado, cada uno de los resultados: 1, 2, 3, 4, 5 y 6 son
sucesos elementales.
 Al conjunto de todos los sucesos elementales posibles se lo llama espacio muestral
(S)
En el ejemplo S = {1, 2 , 3 , 4 , 5 , 6 }
Simbólicamente: S = {s1, s2, s3..... }
El espacio muestral puede ser finito o infinito, numérico o no numérico
 Un suceso que no puede ocurrir ante una repetición de la experiencia aleatoria es un

suceso imposible. Se lo suele indicar ∅.
 Relaciones entre sucesos
Sean A, B y C sucesos asociados a una experiencia aleatoria. Las posibles relaciones

entre los mismos se muestran a continuación gráfica y simbólicamente:
S
_
a A
A
Complemento A ∪A= S
A
b B
Mutuamente excluyentes A∩B=∅
S
A
c B
No mutuamente excluyentes A∩B≠ ∅
 El complemento de cualquier suceso es el conjunto de resultados que no están

contenidos en ese suceso.
PROBABILIDAD 48
 Los sucesos son mutuamente excluyentes si la ocurrencia de uno de ellos impide la

ocurrencia del otro.
Es importante distinguir el conjunto resultante de la unión ( ∪ ) o intersección ( ∩ ) de

sucesos:
 Si A y B son sucesos, A ∪ B es el suceso que ocurre si y sólo si A o B (o ambos)
ocurren.
 Si A y B son sucesos, A ∩ B es el suceso que ocurre si y sólo si A y B ocurren
simultáneamente.
 Ejercicios
Considerando la experiencia aleatoria de arrojar un dado y registrar el nº de la cara superior:

a) Si se pensara en tirar el dado un número infinito de veces: defina la población y clasifíquela.
b) Proponga para la experiencia aleatoria:
- un suceso elemental
- un suceso imposible
- dos sucesos mutuamente excluyentes
- dos sucesos no mutuamente excluyentes
3.3 DEFINICIONES DE PROBABILIDAD
3.3.1 DEFINICION FRECUENCIAL DE PROBABILIDAD
En el punto 3.2.1. se han definido las características de un experimento aleatorio. Un ejemplo

de experiencia aleatoria es el lanzamiento de una moneda. Cuando se lanza una moneda al
aire sólo hay dos resultados posibles, cara o cruz. El resultado no se puede predecir de
antemano y variará cuando se lance en forma repetida, sin embargo se observa una cierta
regularidad en los resultados, una regularidad que sólo emerge después de muchas
repeticiones.
La figura 3.1 muestra la regularidad observada al lanzar una moneda 1000 veces. Para cada
lanzamiento, desde el primero hasta el último, se ha representado la proporción de
lanzamientos que han dado “cara” hasta ese momento. El primer lanzamiento fue cara, por
tanto, la proporción de caras empieza siendo 1. El segundo lanzamiento fue cruz. Después de
los dos lanzamientos, la proporción de caras se ha reducido a 0.5. Los siguientes tres
lanzamientos dieron una cruz seguida de dos caras, por consiguiente, la proporción de caras
después de cinco lanzamientos es 3/5 ó 0,6.
La proporción de lanzamientos que dan cara es bastante variable al principio, pero
posteriormente se estabiliza a medida que se hacen más y más lanzamientos. Llega un
momento en que esta proporción se acerca a 0,5 y se mantiene en ese valor. Se dice que 0,5
es la probabilidad de que salga cara.
Una probabilidad de 0,5 significa que el suceso cara “ocurre la mitad de las veces después de
muchos lanzamientos”. En otras palabras, se puede decir que si se arrojara un gran número
de veces esa moneda al aire, aproximadamente el 50 % de las veces se observaría el
PROBABILIDAD 49
resultado cara o expresándolo en los términos anteriormente vistos, la frecuencia relativa del
suceso cara sería aproximadamente 0,5.
Proporción de caras
Número de lanzamientos
Figura 3.1
Formalizando, se define:
ε : lanzar una moneda al aire y registrar el resultado
El espacio muestral asociado a ε : S ={C;X}
Sea:
s1: cara
n1: frecuencia absoluta del suceso s1
n : nº de repeticiones del ε
n1
f ( s1 ) = : proporción de veces que se verifica cara en n tiradas.
n
Generalizando:
ni
f ( si ) = 
→ P ( si )
n n→ ∞
Es decir, la probabilidad de un suceso (o resultado) es el número hacia el cual tiende la

frecuencia relativa del mismo cuando el número de repeticiones de la experiencia tiende a
infinito. Es decir, es una frecuencia relativa calculada en la población.1
Esta definición de probabilidad se conoce como definición frecuencial de probabilidad2.
1
La interpretación de la probabilidad como frecuencia relativa en el límite se basa en la observación de un gran
número de repeticiones. Surge ahora la pregunta, ¿cuántas repeticiones se deben realizar? Como veremos en el
capítulo 6, con un número finito de repeticiones de la experiencia es posible aproximar la verdadera probabilidad
de un suceso.
2
Este efecto estabilizador de la frecuencia relativa cuando el número de observaciones crece se denomina Ley de
los grandes números.
PROBABILIDAD 50
3.3.2 DEFINICION CLASICA DE PROBABILIDAD O DE LAPLACE
Se ha considerado a la probabilidad de ocurrencia de un resultado determinado de una

experiencia aleatoria, como la proporción de veces (frecuencia relativa) que se obtiene dicho
resultado después de una gran cantidad de repeticiones.
Sin embargo, considerando la experiencia aleatoria de arrojar una moneda, se podría haber
conjeturado sin repetir dicha experiencia, que la probabilidad de obtener el resultado “cara” es
0,5.
Esto se sustenta en que si la moneda no está cargada, cada resultado tiene la misma chance
de ocurrir. Esta descripción permite introducir lo que se conoce como definición clásica de
probabilidad o de Laplace. Esta definición sólo puede ser aplicada si:
 el espacio muestral S consta de un número finito de resultados
S = {s1, s2,......... sk}
 todos los resultados son igualmente probables
P ( s1 ) = P( s 2 ) =  = P ( s k )
Al igual que en las frecuencias relativas, la sumatoria de las probabilidades de todos los
sucesos posibles es igual a 1:
k 1
∑ P ( si ) = 1 ⇒ P ( si ) =
i= 1 k
r
y por lo tanto, si A =  si donde r ≤ k
i= 1
entonces
r r
P( A) = ∑ p( si ) =
i= 1 k
Suele enunciarse como:
n º de resultados favorables a A
P ( A) =
n º de resultados posibles
PROBABILIDAD 51
3.3.3 PROBABILIDAD SUBJETIVA
En los dos enfoques de probabilidad desarrollados anteriormente, se definió a la probabilidad

como la proporción de resultados favorables respecto al total de resultados. En la primera
situación, dicha proporción se basa en datos observados y en la segunda en el conocimiento
previo de un proceso (número finito de resultados igualmente probables).
El tercer enfoque de probabilidad se llama probabilidad subjetiva y se refiere a la probabilidad
asignada a un suceso por una persona en particular. La misma puede ser bastante diferente de
la probabilidad subjetiva que estipula otra persona.
Si un equipo de administración piensa que hay una probabilidad de 0.35 de que un nuevo
producto tenga éxito en el mercado, esto constituye una probabilidad subjetiva. El valor 0.35 es
una opinión, más que un valor basado en una evidencia objetiva.
Este tipo de probabilidad es frecuente en la toma de decisiones en el mercado, siendo
confiable si la determina un experto en la materia.
3.4 PROPIEDADES DE LA PROBABILIDAD
Cualquiera sea el enfoque utilizado para determinar la probabilidad de un suceso A, ésta debe
verificar ciertas propiedades:
 Cualquier probabilidad es un número entre 0 y 1 → 0 ≤ P ( A ) ≤ 1
 Todos los resultados posibles juntos deben tener una probabilidad de 1 → P(S) = 1
 La probabilidad de que un suceso ocurra es igual a 1 menos la probabilidad de que no

ocurra → P ( A ) = 1 − P A ( )
 La probabilidad del suceso imposible es 0 → P ( ∅ ) = 0
 Si dos sucesos no tiene resultados en común, la probabilidad de que ocurra cualquiera

de ellos es igual a la suma de sus probabilidades individuales.
3.5 REGLAS DE LA PROBABILIDAD
Existen varias manera de observar un espacio muestral específico. El método que se utiliza a
continuación implica ubicar los sucesos en una tabla de doble entrada o tabla de contigencia3.
En la tabla siguiente se muestra el número de alumnos varones y mujeres ingresantes en

las distintas carreras de la U.T.N. Rosario, durante el año 2003:
3
Este tipo de tablas fue utilizada para presentar la información de los ejercicios 5 y 6 que se proponen como trabajo
práctico en Estadística Descriptiva (pags. 40-41).
PROBABILIDAD 52
Carrera Ingeniería Ingeniería Ingeniería Ingeniería

I.S.I. Total
Sexo Mecánica Química Eléctrica Civil
Mujer 141 2 50 1 8 202
Varón 496 129 90 68 58 841
Total 637 131 140 69 66 1043
Se considera
 la experiencia aleatoria : seleccionar un alumno al azar de los ingresantes a la Facultad
durante el año 2003
 asociados a la variable cualitativa “sexo”, los sucesos:
 M: ingresante mujer V: ingresante varón
 asociados a la variable cualitativa “carrera a la que ingresa”, los sucesos:
 I : ingresante a I.S.I. F: ingresante a Ing. Mecánica
Q: ingresante a Ing. Química E: ingresante a Ing. Eléctrica
C: ingresante a Ing. Civil
En los puntos siguientes se desarrollarán reglas para obtener diferentes tipos de probabilidad y
para su compresión nos basaremos en la situación planteada anteriormente.
3.5.1 PROBABILIDAD SIMPLE (o MARGINAL)
La probabilidad simple se refiere a la probabilidad de ocurrencia de un suceso simple. Son

probabilidades simples los ejemplos que se presentan:
 Probabilidad de seleccionar un ingresante mujer:
número de ingresantes mujeres 202

P(M ) = = = 0,19
total de ingresantes 1043
 Probabilidad de seleccionar un ingresante varón:
número de ingresantes varones 841

P (V ) = = = 0,81
Observe que los sucesos V y M son sucesos complementarios y por lo tanto, la suma de sus
probabilidades es igual a 1.
PROBABILIDAD 53
 Probabilidad de seleccionar un ingresante a I.S.I.:
número de ingresantes a I .S .I . 637

P(I) = = = 0,61
3.5.2 PROBABILIDAD CONJUNTA
Cuando se está interesado en conocer la probabilidad de que dos sucesos se verifiquen

simultáneamente, se habla de probabilidad conjunta. Por ejemplo se puede estar interesado
en conocer cuál es la probabilidad de seleccionar un alumno del sexo femenino y que sea
ingresante en I.S.I.. Este suceso se expresa como M ∩ I y la probabilidad se obtiene de la
siguiente forma:
número de ingresantes mujeres e inscriptos a I .S .I . 141

P ( M y I) = P ( M ∩ I) = = = 0,14
En la tabla siguiente se presenta la distribución de probabilidades conjuntas y las marginales

respectivas. La distribución marginal está compuesta por el conjunto de probabilidades simples
de los sucesos asociados a cada variable4:
Carrera Distribución
I F Q E C marginal de
Sexo sexo
M 0,14 0 0,05 0 0 0,19
V 0,47 0,12 0,09 0,07 0,06 0,81

Distribución
marginal de 0,61 0,12 0,14 0,07 0,06 1
carrera
Ahora se puede ver la probabilidad de un suceso simple como la suma de las probabilidades
conjuntas que incluyen dicho suceso. Por ejemplo, se puede pensar la P (M) como:
P ( M ) = P ( I ∩ M ) + P ( F ∩ M ) + P (Q ∩ M ) + P ( E ∩ M ) + P (C ∩ M ) =
= 0,14 + 0 + 0,05 + 0 + 0 = 0,19
4
En las celdas sombreadas se presenta la distribución de las probabilidades conjuntas.
PROBABILIDAD 54
En general
k
P ( B ) = ∑ P ( Ai ∩ B )
i= 1
Donde A1 , A2, ....... Ak son k sucesos mutuamente excluyentes.
3.5.3 REGLA DE LA SUMA
Para calcular la probabilidad de que ocurra cualquier suceso, A o B, se usa la regla de la

suma.
Esta regla considera que pueden ocurrir el suceso A, el suceso B o ambos sucesos Ay B.
Regla de la suma
P ( A o B ) = P ( A ∪ B ) = P ( Α ) + P ( Β ) − P ( Α ∩ B)
La probabilidad del suceso A y B se resta de esta suma porque se incluye dos veces al
calcular la probabilidad de A y la probabilidad de B. Esto se podrá visualizar en el siguiente
ejemplo:
 Retomando el ejemplo de los ingresantes a la UTN, podríamos estar

interesados en conocer la probabilidad de seleccionar un ingresante varón o a
la carrera de Ingeniería Química. Aplicando la regla se obtiene:
P (V ∪ Q ) = P ( V ) + P ( Q ) − P (V ∩ Q ) = 0,81 + 0,14 − 0,09 = 0,86
El cálculo de la probabilidad del suceso anterior puede pensarse también de la siguiente

forma:
( ) ( )
P (V ∪ Q ) = P V ∩ Q + P V ∩ Q + P (V ∩ Q ) = 0,72 + 0,05 + 0,09 = 0,86
S
V∩ Q
V∩Q
 Regla de la suma para sucesos mutuamente excluyentes

Para sucesos mutuamente excluyentes, la regla de la suma se reduce a:
P(A∪B) = P(A)+P(B) [ ya que P ( A ∩ B ) = 0 ]
PROBABILIDAD 55
 Regla de la suma para más de dos sucesos

Esta regla se extiende para calcular la probabilidad de ocurrencia de la unión de más de
dos sucesos cualesquiera.
En el caso de tres sucesos ( A, B y C ), se demuestra fácilmente :
P ( A ∪ B ∪ C ) = P( A ) + P( B ) + P( C ) − P( A ∩ B ) − P( A ∩ C ) − P( B ∩ C ) + P( A ∩ B ∩ C )
3.5.4 PROBABILIDAD CONDICIONAL
Hasta ahora se consideró la probabilidad de ocurrencia de un suceso cuando se realiza una

selección aleatoria a partir de un espacio muestral completo. Sin embargo muchas veces se
conoce cierta información acerca de los sucesos implicados en la experiencia aleatoria. En
estas situaciones, cuando se calcula la probabilidad de que ocurra un suceso dado que se
cuenta con la información de la ocurrencia de otro, se está ante una probabilidad
condicional. Veamos esta situación a través del ejemplo de los alumnos ingresantes:
Se consideran los sucesos M : ingresante mujer

I : ingresante a I.S.I.
Supongamos que al realizar la experiencia aleatoria fue seleccionado un alumno ingresante a

la carrera I.S.I.; es decir, se verificó el suceso I. Interesa conocer la probabilidad de que el
alumno seleccionado sea mujer.
Este es un ejemplo de probabilidad condicional y se lo denota como P M I ( ) , e indica la

probabilidad condicional del suceso M sabiendo que se verificó el suceso I.
El cálculo de esta probabilidad puede hacerse por dos caminos:
 El conocimiento de que el alumno seleccionado es un ingresante a la carrera I.S.I. reduce el

espacio muestral S al espacio muestral reducido I.
Por lo tanto :
( )
P MI =
141
637
= 0,22 → probabilidad de M en el espacio muestral reducido I
 El cálculo de la probabilidad condicional a partir de probabilidades calculadas en el espacio

muestral original es :
141
( )
P MI =
141
637
= 1.043 = 0,135 = 0,22
637 0,611
1.043
PROBABILIDAD 56
141 637
Como = P( M ∩ I ) y = P( I )
1043 1.043
Se puede expresar:
(
P M
I
)= P( M ∩ I )
P(I)
con P(I) ≠ 0
Si se compara P(M) (igual a 0,19) y P(M / I ) (igual a 0,22), se observa que el conocimiento
de que el suceso I ocurrió modifica la probabilidad de ocurrencia del suceso M.
Generalizando:
Sean A y B dos sucesos asociados con un experimento ε, P(B/A) indica la probabilidad

condicional del suceso B sabiendo que A se ha verificado.
De acuerdo a lo visto en el ejemplo, el cálculo de P(B/A) se puede realizar a partir de:
 espacio muestral reducido
 espacio muestral original aplicando la siguiente fórmula:
P (B ∩ A)
P( B A )=
P (A) con P ( A ) ≠ 0 (1)
Con el mismo razonamiento:
P( A∩ B )
P( A B )=
P( B )
con P ( B ) ≠ 0 (2)
3.5.5 INDEPENDENCIA ESTADÍSTICA
Como dijimos anteriormente, la probabilidad de seleccionar un ingresante mujer es 0,19; sin

embargo la probabilidad de seleccionar un ingresante mujer cuando se sabe que el ingresante
seleccionado pertenece a ISI, incrementa el valor a 0,22. Este resultado está condicionado por
la información previa.
A diferencia de este ejemplo, cuando el resultado de un suceso no afecta la probabilidad de
ocurrencia de otro suceso, se dice que los sucesos son estadísticamente independientes.
PROBABILIDAD 57
En general:
Los sucesos A y B son independientes si la ocurrencia de uno no afecta en ninguna forma las
posibilidades de que el otro ocurra.
En consecuencia:
P ( A B ) = P (A) o P ( B A) = P (B)
 Se demuestra que si:

A independiente de B ⇒ B independiente de A
y también resultan independientes Ay B , A y B y Ay B
 Volviendo a la situación planteada anteriormente, los sucesos M e I no son

independientes ya que:
P (M I ) ≠ P ( M ) y
P ( I M) ≠ P( I )
Analizando los resultados obtenidos se puede deducir que el conocer que un suceso ha
ocurrido puede aumentar, disminuir o no modificar la probabilidad de ocurrencia de otro suceso
relacionado con el primero. En el caso particular de que un suceso no modifique la probabilidad
de ocurrencia de otro, se dice que los sucesos son independientes.
3.5.6 REGLA DE LA MULTIPLICACIÓN
La fórmula de la probabilidad condicional se puede manipular algebraicamente de modo que la

probabilidad conjunta se puede determinar a partir de la probabilidad condicional de un suceso.
De las ecuaciones (1) y (2) de la página 56, resulta:
P( A∩ B ) = P( A B ) . P( B ) = P( B A ) . P( A )
Esta regla puede aplicarse si se tiene que calcular la probabilidad de que ocurran
conjuntamente tres o más sucesos cualesquiera. Generalizando para n sucesos:
 n 
P   Ai  = P (A1 ) . P ( A2 A1 ) . P ( A3 A1 A2 ) P ( An A1 A2  An - 1 )
 i= 1 
PROBABILIDAD 58
Para la aplicación de la regla de la multiplicación, es importante determinar si los sucesos son

o no independientes.
Luego, si A y B son sucesos independientes, la regla de la multiplicación resulta:
P (A ∩ B) = P ( A ) . P ( B )
Generalizando la regla de la multiplicación a más de dos sucesos independientes:
n n
P (  Ai ) = ∏ P ( Ai )
i= 1 i= 1
Nota:
Se quiere remarcar la diferencia entre dos conceptos muy importantes: sucesos
independientes y sucesos mutuamente excluyentes:
 Mutuamente excluyentes indica que los dos sucesos no pueden ocurrir al mismo
tiempo; por lo tanto su intersección es vacía.
 La independencia indica que un suceso no afecta la probabilidad de ocurrencia del
otro.
 Dos sucesos no pueden ser a la vez mutuamente excluyentes e independientes. Es
decir:
- Si dos sucesos son mutuamente excluyentes, entonces no son independientes.
- Si dos sucesos son independientes, entonces no son mutuamente excluyentes.
 Ejercicios
1. Suponga que se exhiben 20 marcadores en una librería. De estos, 6 son rojos y 14 son
azules. Se seleccionan al azar 2 marcadores del conjunto de 20. Encuentre la probabilidad
de que los dos marcadores seleccionados sean rojos. (Considere los sucesos A 1: el primer
marcador seleccionado es rojo y A2: el segundo marcador seleccionado es rojo)
2. Suponga la experiencia aleatoria del ejercicio 1 pero considerando que el primero de los
marcadores elegidos se regresa al mostrador después de determinar su color. Encuentre la
probabilidad de seleccionar marcadores rojos las dos veces.
PROBABILIDAD 59
3.5.7 TEOREMA DE LAS PROBABILIDADES TOTALES
Muchas veces interesa estudiar la probabilidad de ocurrencia de un suceso, pero sólo se

conoce la probabilidad de ocurrencia del mismo asociada a otros sucesos relacionados
(probabilidades condicionadas) y las probabilidades de ocurrencia de estos sucesos.
A continuación se trabaja sobre una situación que ejemplificará lo anteriormente expuesto:
Entre la población económicamente activa de una ciudad, el 40% ha completado el nivel

de instrucción primario, el 50 % el nivel de instrucción secundario y el 10% la universidad.
Entre los individuos que tienen educación primaria hay una 10 % de desempleados, entre los
que tienen educación secundaria un 5 % y entre los graduados universitarios un 2 %. ¿Cuál
es la probabilidad de que un individuo económicamente activo esté desempleado?
 Sean los sucesos:
B : desempleado.
A1 : nivel de instrucción primario completo.
A2 : nivel de instrucción secundario completo.
A3 : nivel de instrucción universitario completo.
 Y sus probabilidades:
P(A1) = 0,40 P(A2) = 0,50 P(A3) = 0,10
P(B/A1) = 0,10 P(B/A2) = 0,05 P(B/A3) = 0,02
Observe que:
A1 , A2 , A3 representan una partición de S y B otro suceso relacionado con Ai .
Se puede expresar:
B = ( A1 ∩ B ) ∪ ( A2 ∩ B ) ∪ ( A3 ∩ B )
Si se conocen:
Sucesos A1 A2 A3 Probabilidad
B 0,04 0,025 0,002 0,067
B 0,36 0,475 0,098 0,933

P (Ai) 0,40 0,50 0,10 1
Luego,
3 3
P (B ) = ∑ P (Ai ∩ B ) = ∑ P (Ai ) . P( B Ai ) =
i= 1 i= 1
= 0.4 ⋅ 0.1 + 0.5 ⋅ 0.05 + 0.1 ⋅ 0.02 = 0.067
Esto indica que un 6.7 % de los trabajadores están desempleados.
PROBABILIDAD 60
Generalizando
k
P (B) = ∑ P ( Ai ) ⋅ P ( B Ai )
i= 1
Esta aplicación se conoce como Teorema de las probabilidades totales.
Para resolver este tipo de problemas también es útil recurrir a un diagrama de “árbol”:
P(A1y∩ B) = P(A11) (B/A11)

P (B/A1)
= (0,4) (0,01)
(0,1) ==0,04
0,004
_
P (A1) P (B/A1)
P(A2 ∩ B) = P(A2) (B/A2)
P (B/A2)
P ( A2 ) = (0,5) (0,05) = 0,025
_
P (B/A2)
P (A3) P(A3 ∩ B) = P(A3) (B/A3)
P (B/A3)
= (0,1) (0,02) = 0,002
_
P (B/A3)
3.5.8 TEOREMA DE BAYES
La probabilidad condicional toma en cuenta información acerca de la ocurrencia de un suceso

para encontrar la probabilidad de otro. Este concepto puede extenderse para revisar
probabilidades basadas en nueva información y para determinar la probabilidad de que un
efecto en particular se deba a una causa específica. El procedimiento para revisar estas
probabilidades se conoce como teorema de Bayes.
Se retoma el ejemplo de los trabajadores para aplicar este teorema. Suponga que se elige un
trabajador al azar y se encuentra que es un desempleado ¿cuál es la probabilidad de que
hubiera terminado sus estudios secundarios?
El teorema de Bayes puede desarrollarse a partir de la definición de probabilidad condicional:
P( A2 ∩ B) 0.025
P (A2 / B) = =
P( B ) 0.067
PROBABILIDAD 61
Se puede decir que ciertas “causas” (por ej. tipo de educación: A1, A2 , A3....) tienen
probabilidades a priori P(Ai). Existe un “efecto” B (desempleo), que no siempre ocurre cuando
la causa está presente, por eso se habla de P(B/Ai).
Cuando se usa la probabilidad condicional para invertir lo anterior, se calcula la probabilidad de
una causa, dado el efecto, es decir, la probabilidad a posteriori P (Ai/B)
Dado Se deduce
P ( Ai)
→ P (Ai / B)
P (B / Ai)
En general, el Teorema de Bayes se obtiene en la ecuación:
P (Aj) ⋅ P ( B Aj )
P (Aj B ) = k
∑ P (Ai) ⋅ P ( B Ai )
i= 1
j= 1, 2, 3, .....k
Observe que el denominador no es más que la aplicación del teorema de las probabilidades
totales.
PROBABILIDAD 62
3.6 TRABAJO PRÁCTICO
1. Un conmutador consta de dos líneas L1 y L2. En un momento “t” cualquiera, cada una de las
líneas puede encontrase congestionada ( C ) o descongestionada ( D ).
a) Describa los posibles resultados de observar el estado del conmutador en un momento
“t”.
b) Suponga que se conocen las probabilidades de los sucesos elementales del espacio
muestral:
L1
Congestionada Descongestionada
L2
Congestionada x 0,10
Descongestionada 0,10 0,79
Determine el valor de x e indique que representa dicho valor.

c) Calcule las probabilidades de cada uno de los siguientes sucesos (resuelva
considerando los sucesos F: la línea L1 está congestionada y G: la línea L2 está
congestionada)
A: al menos una línea está congestionada
B: ambas líneas están congestionadas
C: ambas líneas están descongestionadas
D: sólo una línea está congestionada
E: a lo sumo una línea está congestionada
2.- Considere el ejercicio 6 de la unidad nº 2 Estadística descriptiva (pág. 43)
Una compañía de seguros registró entre sus asegurados el número de accidentes del año
2003, obteniendo la siguiente información:
Edad del asegurado (E) (F) (G) (H) (I)

Totales
N° de accidentes [18-28) [28-38) [38-48) [48-58) 58 y más
0 (suceso A) 748 821 786 720 672 3747

1 (suceso B) 84 50 41 66 60 301
2 (suceso C) 41 15 12 16 25 109
más de 2 (suceso D) 10 9 5 5 8 37
Totales 883 895 844 807 765 4191
a) ¿Qué variables se pueden identificar en este estudio? Clasifíquelas.
Calcule la probabilidad de que un asegurado elegido al azar:

b) tenga entre 28 y 38 años de edad
c) haya tenido un accidente
d) haya tenido un accidente y tenga entre 28 y 38 años de edad
PROBABILIDAD 63
e) haya tenido un accidente si tiene entre 28 y 38 años de edad

f) Calcule las probabilidades para los sucesos simples asociados a la variable “nº de
accidentes”.
3.- Un contratista tiene ocho proveedores a los cuales puede comprarles insumos eléctricos.
Seleccionará aleatoriamente a tres de ellos y pedirá a cada uno que presente una
cotización del proyecto.
a) ¿De cuántas maneras puede seleccionarse a los proveedores?
b) Si su compañía es uno de los ocho proveedores ¿cuál es la probabilidad de que tenga
oportunidad de cotizar el proyecto?
4.- Una compañía recibe un embarque de 20 discos duros. Antes de aceptarlo, selecciona
aleatoriamente cinco de ellos y los somete a prueba. El embarque se acepta si los cinco
discos cumplen con las especificaciones, en caso contrario se regresan todos al fabricante.
Si tres de los 20 discos son defectuosos.
a) ¿De cuántas maneras pueden seleccionarse una muestra de cinco discos duros?
b) ¿De cuántas maneras pueden seleccionarse una muestra de cinco discos duros que
cumplan con las especificaciones?
c) ¿cuál es la probabilidad de que no se acepte el embarque?
5.- Cuando una computadora se bloquea, existe una probabilidad de 75% de que se deba a
una sobrecarga, y de 15% de que sea por un problema de software. La probabilidad de que
se origine en una sobrecarga o un problema de software es de 85%.
a) ¿Cuál es la probabilidad de que se deba a ambos problemas?
b) ¿Cuál es la probabilidad de que haya un problema de software sin sobrecarga?
6.- Un número binario está compuesto sólo de los dígitos cero y uno. Suponga que un número
binario está formado por n dígitos. La probabilidad de que aparezca un dígito incorrecto es
“p” y los errores en dígitos diferentes son independientes uno del otro.
¿Cuál es la probabilidad de formar un nº incorrecto?.
7.- Una compañía de automóviles ha determinado que un nuevo comprador de autos solicitará
aire acondicionado instalado en fábrica en el 30 % de los casos. Calcule la probabilidad de
que:
a) los siguientes 4 compradores soliciten aire acondicionado en fábrica
b) ninguno de los siguientes 3 compradores soliciten aire acondicionado en fábrica
c) dos de los siguientes 4 compradores soliciten aire acondicionado en fábrica
d) de los siguientes 4 compradores sólo el último solicite aire acondicionado en fábrica
8.- El gerente de una empresa de colocaciones desea estudiar varias características de las
personas que solicitan trabajo, entre ellas si el solicitante estuvo en el último empleo por lo
menos 5 años y si tienen título universitario. Se selecciona una muestra de 600 solicitantes
obteniéndose la siguiente tabla de frecuencias:
PROBABILIDAD 64
Universitario
Ultimo empleo Si No Total
por lo menos 5 años
Si 100 180 280
No 220 100 320
Total 320 280 600
Calcule el porcentaje de solicitantes

a) con título universitario
b) que estuvieron en el último empleo por lo menos 5 años
c) con título universitario y que haya estado en el último empleo por lo menos 5 años
d) sin título universitario y que haya estado en el último empleo por lo menos 5 años
e) no tenga título universitario o haya estado en el último empleo por lo menos 5 años
f) con título universitario que hayan estado más de 5 años en el último empleo
g) que habiendo estado más de 5 años en el último empleo, no tengan título universitario
∗ ¿Pueden considerarse estos porcentajes como indicadores de probabilidades de los
respectivos sucesos?
** Indique cuál o cuáles serían los supuestos apropiados para que esto fuera así e
interprete los items del punto anterior en términos de probabilidad.
*** Analice la independencia de los sucesos: “el solicitante tiene título universitario” y “el
solicitante estuvo en el último empleo por lo menos 5 años”.
9.- Una empresa dedicada al procesamiento de datos considera que al probar por primera vez
un programa se pueden encontrar:
- errores importantes (que ocasiona que el programa falle por completo)
- errores menores (fallas que permiten que el programa se corra, pero que en algunas
situaciones producen resultados erróneos)
- ningún error
De experiencias anteriores se conoce que la probabilidad de que al correr por primera vez el
programa se encuentren errores importantes es 0,6; de encontrar errores menores es 0,3 y
de no encontrar errores es 0,1. En caso de haber errores se trata de corregirlos y se vuelve
a probar el programa.
La tabla siguiente muestra las probabilidades de los resultados en la 2ª prueba condicionada
a los de la 1ª :
2ª
prueba Importante Menor Ninguno
1ª prueba
Importante 0,3 0,5 0,2
Menor 0,1 0,3 0,6
Ninguno 0 0,2 0,8
a) Construya una tabla de probabilidades conjuntas y un árbol de probabilidad
b) Encuentre la probabilidad de descubrir un error importante durante la segunda prueba
c) Encuentre la probabilidad de error menor en la primera prueba sabiendo que el error en
la segunda prueba es importante
d) Analice la independencia entre los resultados de la primera prueba con los de la
segunda.
PROBABILIDAD 65
10. En un gran hospital de niños, el inspector de calidad de las partidas de leche en polvo que
el gobierno envía, acepta (A) el 90 % de las mismas y rechaza el resto. De experiencias
anteriores se conoce que el 95 % de los lotes que envía el gobierno son buenos (B) y el
resto presenta algún defecto (D). El inspector rechaza el 94 % de los lotes defectuosos que
inspecciona.
a) Construya la tabla de probabilidades conjuntas de acciones a tomar versus la calidad
del lote
b) ¿Qué porcentaje de los lotes inspeccionados son malos y se los rechaza?.
c) ¿Qué porcentaje de los lotes inspeccionados son buenos y se los acepta?.
d) Calcule la probabilidad de que el inspector se equivoque al inspeccionar un lote.
11.- Los pedidos nuevos de un producto de una compañía varían en valor monetario según la
siguiente distribución de probabilidades:
Monto de ventas 0-1000 1001-2000 2001-3000 3001-4000 más de 4000

Probabilidad 0.1 0.35 0.25 0.20 0.10
Calcule la probabilidad de que:

a) un nuevo pedido tenga un monto mayor que $ 2000
b) un nuevo pedido tenga un monto entre $ 2000 y $ 4000
c) Se conoce además que la forma de pago de los pedidos puede ser al contado o en
cheques, dándose los mismos en los siguientes porcentajes:
– 70 % pagan de contado si el monto no supera los $2000
– 50 % se pagan de contado si el monto está entre $2000 y $4000
– el 80 % de los pedidos con montos superiores a $4000 se pagan con cheques.
Calcule:
c1) el porcentaje de pedidos pagados de contado
c2) el porcentaje de pedidos con un monto superior a 4000$ entre los que fueron
pagados de contado.
12.- Un centro de cómputo tiene tres impresoras, A, B, y C, que imprimen a velocidad distinta.
Los programas se envían a la primera impresora disponible. Las probabilidades de que un
programa se envíe a las impresoras A, B, y C son de 0.6, 0.3 y 0.1 respectivamente. En
ocasiones los impresos se atoran en la impresora y se destruyen. La probabilidad de que se
atore el papel en las impresoras A, B, y C son de 0.01, 0.05 y 0.04 respectivamente.
a) ¿Cuál es la probabilidad de que si un programa escrito se destruyó, ello haya ocurrido en
la impresora A?
b) ¿haya ocurrido en la impresora B?
c) ¿haya ocurrido en la impresora C?
13.- El editor de una compañía que edita libros de texto quiere decidir si va a publicar un libro
de estadística para administración. El análisis de los libros de texto que se publicaron
anteriormente indica que 10 % fueron grandes éxitos, 20% tuvieron un éxito modesto, 40 %
lograron recuperar los gastos de inversión y 30 % fueron un fracaso. Sin embargo, antes de
tomar una decisión se va a realizar un dictamen del libro. En el pasado obtuvieron
dictámenes favorables el 99 % de los grandes éxitos, el 70 % de los éxitos modestos, el 40
% de los títulos que alcanzaron a recuperar gastos de inversión y el 20 % de los fracasos.
a) ¿Qué proporción de libros de texto reciben dictámenes favorables?
b) Si el libro propuesto obtiene un dictamen favorable, ¿cómo debe revisar el editor las
probabilidades de los diferentes resultados para tomar en cuenta esta información?
4. VARIABLES
ALEATORIAS
UNID I M E N S IO NAL ES
CONTENIDO
4. VARIABLES ALEATORIAS
UNIDIMENSIONALES............................ 65
4.1 VARIABLES ALEATORIAS DISCRETAS.......................................... 66
4.1.1 DISTRIBUCIONES DE PROBABILIDAD............................. 66
4.1.2 PARAMETROS ESTADISTICOS........................................... 68
4.1.3 EJERCICIOS RESUELTOS.................................................... 70
4.2 VARIABLES ALEATORIAS CONTINUAS........................................ 71

4.2.l FUNCION DE DENSIDAD..................................................... 71
4.2.2 PARAMETROS ESTADISTICOS........................................... 73
4.2.3DESIGUALDAD DE CHEBYSHEV......................................... 73
VARIABLES ALEATORIAS UNIDIMENSIONALES 66
PRIMERA PARTE
4. VARIABLES ALEATORIAS UNIDIMENSIONALES
Las experiencias aleatorias dan como resultado sucesos elementales. Una variable
aleatoria se define al asignar un valor numérico a cada suceso elemental de una
experiencia aleatoria. Es decir, una variable aleatoria numérica es un fenómeno de interés
cuyos resultados se expresan con números.
Como se vio en el capítulo 1, las variables aleatorias numéricas se clasifican como discretas
o continuas, las primeras surgen del proceso de contar y las segundas de un proceso de
medir.
Ejemplos: número de hijos por familia, sueldo de empleados administrativos, número de

llamadas telefónicas que llegan a una central, longitud de cierta pieza, etc.
4.1 VARIABLES ALEATORIAS DISCRETAS
Una variable es discreta cuando el conjunto de valores posibles que puede asumir (llamado
rango o recorrido de la variable: RX) es un conjunto finito o infinito numerable.
 Ejercicios
Identifique cuáles de las siguientes variables aleatorias pueden clasificarse como discretas:
a) Número de alumnos por curso

b) Número de respuestas correctas de un examen por alumno
c) Años completos trabajados por un empleado
d) Tiempo que tarda un alumno en llegar a la escuela
e) Tiempo de demora en la llegada de un determinado tren
f) Consumo de gas natural por hogar en una ciudad
4.1.1 DISTRIBUCIONES DE PROBABILIDAD
En el capítulo 2 se presentó para un conjunto de datos correspondientes a una variable

discreta la distribución de frecuencias (absolutas o relativas).
Pensando ahora en todos los valores posibles que puede asumir la variable aleatoria
discreta y la probabilidad asociada a cada valor se dice que:
Una distribución de probabilidad es la enumeración de todos los valores posibles que puede
asumir una variable aleatoria, junto con sus probabilidades.
Ejemplo :
La tabla 4.1 representa la distribución de probabilidad del número de empleados ausentes
por día en una empresa:
TABLA 4.1 :
Nº de empleados Probabilidad
Probabilidad
ausentes por día acumulada
( pi )
( xi ) F(xi )
1 0,085 0,085
2 0,118 0,203
3 0,184 0,387
4 0,217 0,604
5 0,127 0,731
6 0,118 0,849
7 0,104 0,953
8 0,047 1
1,000
GRÁFICA DE LA DISTRIBUCIÓN DE PROBABILIDAD
FIGURA 4.1
0,25
0,2
Probabilidad
0,15
0,1
0,05
0
0 1 2 3 4 5 6 7 8 9
Número de empleados ausentes
Observaciones : ¿??
 pi ≥ 0 ∀i
 ∑p
∀i∈R
i =1 (condición de cierre).
La distribución de probabilidad debe contener todos los valores posibles que puede
tomar una variable aleatoria. Por lo tanto la suma de las probabilidades debe ser
igual a 1.
x
 F ( x ) = P ( X ≤ x) = ∑ P( X = k)
k= 0
F (x) es la Función de distribución de Probabilidad Acumulada.
 Ejercicios
1.- ¿Qué es una distribución de probabilidad?

2.- ¿Cuál es la diferencia entre una distribución de probabilidad y una distribución de
frecuencias?
3.- Sea X: número de accidentes diarios en una planta industrial. Los datos fueron
obtenidos durante un período de tiempo prolongado:
Número de accidentes Proporción de

diarios días
0 0,51
1 0,28
2 0,15
3 0,03
4 0,03
a) ¿Es ésta una distribución de frecuencias o una distribución de probabilidad?

Fundamente su respuesta.
b) Represente gráficamente.
c) ¿Cuál es la probabilidad de que haya dos accidentes en un día?
d) ¿Cuál es la probabilidad de que haya por lo menos dos accidentes diarios?
4.1.2 PARAMETROS ESTADISTICOS
Son las medidas que resumen la información que brinda una distribución de probabilidad así
como los estadísticos resumen la información que brinda una distribución de frecuencias.
• ESPERANZA MATEMÁTICA O PROMEDIO POBLACIONAL
La esperanza matemática es el valor promedio de una variable aleatoria X. Se la nota

como E ( X ) o µ .
La fórmula para el cálculo de la esperanza matemática de una variable aleatoria discreta
X está dada por:
∞
E ( X ) = ∑ xi . pi
i= 1
En el ejemplo de la tabla 4.1 el promedio poblacional es 4.2 , es decir el número

promedio de empleados ausentes por día es de 4,2 empleados. Se simboliza E (X) =
4,2 empleados.
• VARIANZA POBLACIONAL
Es una medida de dispersión y se la nota como V ( X ) o σ2 .

La fórmula para el cálculo de la varianza está dada por:
( )
∞
∑ (x μ ) . pi = E [ X − E ( X ) ] 2 = E X 2 − [ E ( X ) ] 2
2 2
σ =
i= 1
i −
Observe que puede expresarse como el promedio de los desvíos al cuadrado.
• DESVIACION ESTANDAR POBLACIONAL
Es la raíz cuadrada positiva de la varianza y su ventaja es que trabaja con las mismas
unidades en las que está expresada la variable.
Así : D(X ) = σ = + σ2
En el ejemplo de la tabla 4.1 la varianza es 3,67 (empleados) 2, de donde la desviación
estándar es 1,92 empleados. Se simboliza D ( X ) = 1,92 empleados
 Ejercicios
1.- Una compañía desea introducirse en el mercado de la electrónica. A tal fin, analiza el
número de unidades defectuosas en su línea de chips para computadora.
Sea X: número de unidades defectuosas producidas por esta línea en un día normal. La
variable X puede asumir los valores 0, 1, 2, 3 y 4, con las correspondientes
probabilidades 0,40, 0,30, 0,15, 0,10 y 0,05.
Calcule el promedio y la desviación de la variable aleatoria X e interprete.
2.- Sea X una variable aleatoria con promedio µ y desvío estándar σ. Determine la
esperanza matemática y la varianza de la variable aleatoria Z ( a la que se conoce con el
nombre de variable estandarizada ) y se define como :
X− μ
Z=
σ
4.1.3 EJERCICIOS RESUELTOS
1.- Identifique cuáles de las siguientes variables aleatorias se pueden clasificar como
discretas:
a) El número de personas que pasan por una caja registradora
b) Cantidad de mm3 en botellas de gaseosa
c) Edad de los alumnos de la UTN – Fac. Reg. Rosario
d) El número de ventas hechas por un vendedor de autos en un mes
e) Duración de un tubo fluorescente
f) El número de ofertas recibidas sobre una casa en venta
Solución : son variables discretas a ) , d ) y f ) .
2.- La compañía constructora “M.L” está teniendo problemas con herramientas que se
rompen. La distribución de probabilidad del número de herramientas rotas diariamente
es:
Número de herramientas
Probabilidad
rotas por día
0 0,30
1 0,25
2 0,15
3 0,20
4 ó más 0,10
a ) Calcule la probabilidad de que en un día cualquiera haya tres herramientas rotas

b ) Calcule la probabilidad de que en un día cualquiera haya más de una herramienta rota
c ) Calcule la probabilidad de que no haya herramientas rotas en los próximos dos días
(considere que las roturas en diferentes días son independientes)
Solución :
X : número de herramientas rotas :
a ) P ( X = 3 ) = 0,20
b ) P ( X > 1 ) = P ( X = 2 ) + P ( X = 3 ) + P ( X = 4 ) = 0,15 + 0,20 + 0,10 = 0,45

c ) P ( X = 0 ∩ X = 0 ) = P ( X = 0 ) * P ( X = 0 ) = 0,30 * 0,30 = 0,09
3.- La compañía Nutra ha determinado que si se comercializa un nuevo tipo de edulcorante,

la siguiente distribución de probabilidad describiría su contribución a las ganancias de la
empresa durante los siguientes tres meses :
Contribución a las
Probabilidad
ganancias
- $ 3000 0,20
$ 5000 0,50
$ 20000 0,30
Calcule E(X) e interprete.

Solución:
X: contribución a la ganancia
E ( X ) = 0,2 * (- 3000) + 0,5 * 5000 + 0,3 * 20000 = $ 7900
La interpretación queda propuesta para el alumno.
4.2 VARIABLES ALEATORIAS CONTINUAS
En las distribuciones de probabilidad presentadas hasta ahora, las variables aleatorias

toman sólo valores aislados (Rx finito o infinito numerable), por lo tanto se hacía referencia a
distribuciones de probabilidad de variables aleatorias discretas. Ahora se verán
distribuciones de probabilidad para variables aleatorias continuas, es decir, para aquellas
variables que pueden tomar cualquier valor dentro de un intervalo de los Reales.
Una variable aleatoria es continua cuando el rango o recorrido de la misma ( Rx ) es un

conjunto infinito no numerable.
Ejemplos: tiempo de demora en el otorgamiento de un crédito, años de antigüedad de los

empleados de una empresa, duración de componentes electrónicas, etc.
4.2.l FUNCION DE DENSIDAD
En el capítulo 2 se vio que la representación gráfica de una variable continua se realiza a

través de un histograma con su correspondiente polígono de frecuencias relativas. La
siguiente figura muestra que a medida que aumenta el tamaño de la muestra y disminuye la
amplitud del intervalo de clase, el polígono de frecuencias tiende a una curva llamada curva
de densidad :
La curva de densidad es la representación de una función, llamada función de densidad,

que se simboliza con ƒ(x ) y que verifica:
• f ( x) ≥ 0
+∞
• ∫ f ( x ) dx =
−∞
1 (condición de cierre)
d
• P ( c≤ X ≤ d ) = ∫ f ( x ) dx
c
Observaciones:
 La probabilidad de que un valor de X sea igual a cualquier valor

específico es cero, en consecuencia, el signo de igualdad puede o no incluirse
en la especificación del intervalo. Es decir:
P(c≤ X ≤ d)= P( c≤ X < d )= P(c< X ≤ d)= P( c< X < d )
 Se define:
x
F ( x ) = P (X < x) = ∫ f ( s ) ds .
-∞
Función de distribución de probabilidad acumulada de X.
 Se deduce:
d
f (x) = F (x)
dx
4.2.2 PARAMETROS ESTADISTICOS
• ESPERANZA MATEMATICA O PROMEDIO POBLACIONAL
+∞
E( X ) = ∫ x f ( x) dx
−∞
• VARIANZA POBLACIONAL
( )
+∞ 2
V(X) = σ 2
= ∫ ( x − µ ) f ( x ) dx = E X 2 − [ E( X ) ] 2
−∞
• DESVIACION ESTANDAR POBLACIONAL
D( X ) = σ = + σ 2
4.2.3 DESIGUALDAD DE CHEBYSHEV
La desigualdad de Chebyshev muestra una propiedad muy útil de la desviación estándar. En

particular dice que, independientemente de cómo se distribuyan los valores de la variable
aleatoria X, al menos (1 – 1/ k2) % de dichos valores estarán a menos de k desviaciones
estándar del promedio.
Es decir:
P[ X-μ ≥ kσ ]≤ 1
(a)
k2
P[ X-μ ≤ kσ ]≥ 1
1- (b)
k2
Trabajando la desigualdad (b), cota de la

para algunos valores de k: k
probabilidad
2 0,75
3 0,89
4 0,94
La aplicación de esta regla es útil cuando no se conoce la función de probabilidad de la

variable y nos permite obtener valores aproximados de las probabilidades asociadas a dicha
variable.
Observación: recordar regla empírica para distribuciones simétricas ( pag. 33 ).
Ejemplo :
En una fábrica la edad promedio de los operarios es de 44,8 años con una desviación
estándar de 9,7 años. Al usar la desigualdad de Chebyshev para k = 2 se obtiene:
[ X-µ ≤ kσ ]= µ - kσ ≤ X ≤ µ + kσ =
= 44,8 - 2 * 9,7 ≤ X ≤ 44,8 + 2 * 9,7 = 25,4 ≤ X ≤ 64,2
Es decir que al menos el 75 % de las edades de los operarios de la fábrica están entre
25,4 y 64,2 años, o lo que es lo mismo, la probabilidad de que un operario de la fábrica
(elegido al azar) tenga entre 25,4 y 64, 2 años es al menos de 0,75. Si se hubiese
conocido la función de densidad correspondiente a los años de los operarios de la fábrica
se hubiese podido calcular con exactitud el porcentaje de edades de los operarios que se
encuentra a menos de dos desviaciones estándar del promedio.
 Ejercicios
1.- Una variable aleatoria continua X tiene un promedio de 9,2. ¿Qué valor máximo puede
admitirse para el desvío estándar σ, si se desea que la variable se encuentre en el
intervalo (9,0 ; 9,4) con una probabilidad de al menos 0,889?
2.- Sea X la variable que representa la cantidad de lluvia caída en una semana en una región
determinada. Supóngase que µ = 20 mm y σ = 5 mm. Una persona afirma que es
frecuente que en esa región llueva más de 50 mm en una semana. ¿Qué opina Ud.
VARIABLES
4.
ALEATORIAS
UNID I M E N S IO NAL ES
CONTENIDO
4.3 ALGUNAS DISTRIBUCIONES IMPORTANTES DE PROBABILIDAD... 75
4.3.1 DISTRIBUCION BINOMIAL................................................. 75
4.3.2 DISTRIBUCION HIPERGEOMETRICA............................. 81
4.3.3 DISTRIBUCION DE POISSON............................................... 83
4.3.4 DISTRIBUCIÓN UNIFORME................................................ 88
4.3.5 DISTRIBUCIÓN NORMAL.................................................... 90
4.3.6 DISTRIBUCIÓN EXPONENCIAL......................................... 98
4.3.7. EJERCICIOS RESUELTOS................................................. 101
4.4 FUNCION DE VARIABLE ALEATORIA................................................... 104
4.5 EJERCICIOS PROPUESTOS....................................................................... 106
SEGUNDA PARTE
4.3 ALGUNAS DISTRIBUCIONES IMPORTANTES DE PROBABILIDAD
Seguidamente se presentan las distribuciones de probabilidad de tres variables

aleatorias discretas:
4.3.1 DISTRIBUCION BINOMIAL
Se han estudiado numerosas distribuciones de probabilidad que “modelizan” características

asociadas a fenómenos que se presentan frecuentemente en la realidad.
Una distribución de probabilidad de variable aleatoria discreta que se usa frecuentemente es
la distribución binomial.
A partir de una experiencia en la que ocurre uno de dos resultados posibles: A o A (llamada
experiencia de Bernoulli) y ante n repeticiones independientes de la misma, se define la
variable binomial X : nº de veces que ocurre el resultado A en las n repeticiones.
• HIPOTESIS DE LA DISTRIBUCION BINOMIAL
1.- Existen n repeticiones idénticas que conducen a uno de dos resultados: éxito o
fracaso (A y A ).
2.- La probabilidad de cada resultado permanece constante de repetición en repetición.
La probabilidad de uno de estos resultados, llamado éxito, se designa por p (p=
P(A)).
3.- Las repeticiones son independientes.
Un ejemplo de un experimento binomial es el de lanzar una moneda al aire varias veces.

Sólo hay dos resultados posibles en cada tirada (o repetición de la experiencia) de la
moneda: cara o cruz. La probabilidad de obtener cara o cruz se mantiene constante de
tirada en tirada (0,5 para cada una) y las tiradas son independientes entre sí.
Ejemplo
Suponga que 0,2 es la probabilidad de que una persona, que se conecta a un sitio
específico en un centro comercial en la red www, compre un artículo. Si el sitio tiene en
un momento determinado tres personas que se han conectado, ¿cuál es la probabilidad
de que exactamente dos personas compren un artículo?.
Este es un ejemplo que se puede modalizar por binomial, ya que:
 sólo hay dos resultados posibles ante cada conexión a la red de una persona: compra
( C) o no compra ( C ).
 La probabilidad de comprar o no comprar se mantiene estable, con una probabilidad
histórica de ocurrencia de 0,2 y 0,8 respectivamente.
 Las conexiones se consideran independientes entre sí.
Un método gráfico útil para visualizar esta situación es el diagrama de árbol que aparece
en la siguiente figura:
FIGURA 4.2
C 0,2
C,08
C 0,2 0,032
C 0,2 0,032
C,08
C 0,2
C,08
C 0,2 0,032
C 0,8
C 0,2
C 0,8
CC,08 0,8 C 0,2
C C,08 0,8
Cada rama en la figura 4.2 representa la conexión de una persona (recuerde que se
consideran tres). La regla de la multiplicación se usa para calcular la probabilidad de cada
manera independiente en la que pueden ocurrir dos compras. Observe que cada manera
tiene la misma probabilidad (0,032). La regla de la suma se usa después para calcular la
probabilidad final de que dos personas de tres que se conectaron al sitio realicen una
compra (0,096).
Así la probabilidad final es:
3 . (0,2 . 0,2 . 0,8) = 0,096
La primera parte de este cálculo indica el número de maneras ( 3 ) en las que puede ocurrir
el resultado deseado ( dos personas compran un artículo) .
El segundo cálculo ( 0,2 . 0,2 . 0,8 ) indica la probabilidad de lograr este resultado usando
una de las trayectorias posibles en el diagrama.
El resultado final (0,096) es la probabilidad de que al conectarse tres personas al sitio, dos
compren un artículo.
Este cálculo requiere la fórmula binomial:
En general, siendo X : nº de veces que ocurre el resultado A en las n repeticiones.
 n
P ( X = x) =   p x ( 1 − p ) n− x
 x
Distribución de probabilidad de una variable discreta X binomial
donde P ( X = x ) = probabilidad de x éxitos en n repeticiones

n = número de repeticiones
 n
 x  = número de maneras de obtener exactamente x éxitos en n repetic.
 
p = probabilidad de éxito en cualquier repetición
( 1 - p ) = probabilidad de fracaso en cualquier repetición
Para llegar a la fórmula binomial planteada se considera la variable X: nº de éxitos en n

repeticiones de una experiencia ( ε ) y el resultado X = k. Tal resultado aparecería, por
ejemplo, si A ocurre en las primeras k repeticiones de ε , mientras que en las últimas n-k
repeticiones resultase A , es decir:
A A A A A A A A
 
K n− k
Como todas las repeticiones son independientes, la probabilidad de esta sucesión

particular sería:
p k (1-p) n-k
Pero exactamente la misma probabilidad estaría asociada con cualquier otro resultado
 n
para el cual X = k. El número total de tales resultados es igual a  k  ya que hay  k 
 n
   
ordenamientos distintos de los kA y de los (n-k) A , siendo resultados mutuamente
excluyentes. Por lo tanto:
 n
P ( X = k) =   pk ( 1− p ) n− k
 k
En el ejemplo de la conexión en la red al sitio de un centro comercial, la probabilidad

buscada se podría haber calculado de la siguiente forma :
Se define la variable X: número de personas que compran entre tres que se conectan.
X ∼ Bi ( 3 ; 0,2 )
lo que se lee :
la variable aleatoria X se distribuye ( ∼ ) según una distribución binomial ( Bi ) de parámetros
3 ( n ) y 0,2 ( p ) .
 3
Entonces: P ( X = 2 ) =   0,2 2 (1 − 0,2 ) 3 − 2 = 0,096
 2
• PARAMETROS ESTADISTICOS
Se demuestra que:
n
 n
E(X)= ∑ k   p k (1 − p )
n− k
= np
k= 0  k
V(X ) = ( )
E X 2 − [ E ( X )] =
2
n . p . (1 − p )
• CALCULO DE PROBABILIDADES BINOMIALES
Se pueden calcular por tablas específicas (ver apéndice 2, tabla 2.1), con calculadoras,
con algunas planillas de cálculos o con softwares estadísticos.
Ejemplo:
Una firma comercial posee un gran número de cuentas por cobrar y se conoce que el
10% de estas cuentas están vencidas. Si se escogen aleatoriamente 5 cuentas, calcule la
probabilidad de que:
a ) exactamente dos cuentas estén vencidas

b ) a lo sumo dos cuentas estén vencidas
c ) por lo menos una cuenta esté vencida
d ) por lo menos una cuenta no esté vencida
e ) entre 2 y 4 cuentas estén vencidas
• Por tabla
De la tabla de probabilidades acumuladas se puede obtener la probabilidad puntual por

diferencia de probabilidades acumuladas. Así:
X : número de cuentas vencidas en un total de 5
X ∼ Bi ( n , p ) = Bi ( 5 ; 0,10 )
a) P ( X = 2 ) = P ( X ≤ 2 ) - P ( X ≤ 1 ) = F ( 2 ) - F ( 1 ) = 0,991 - 0,918 = 0,073

b) P ( X ≤ 2 ) = F ( 2 ) = 0,991
c) P ( X ≥ 1 ) = 1 - P ( X = 0 ) = 1 - F ( 0 ) = 1 - 0,591 = 0,409
d) Calcular la probabilidad de que entre 5 cuentas elegidas al azar, por lo menos una
cuenta no esté vencida , es equivalente a calcular la probabilidad de que a lo sumo
cuatro estén vencidas, en el ejemplo :
P(X≤4) = 1
e) P ( 2 ≤ X ≤ 4 ) = F ( 4 ) - F ( 1 ) = 1 - 0,918 = 0,082
Utilizando EXCEL en Funciones estadísticas el cálculo de las probabilidades binomiales se

presenta de la siguiente forma (se consideran los puntos b y a del ejemplo anterior):
ASISTENTE PARA FUNCIONES
Dist. Binomial VALOR 0,99144
número éxito f (x) 2
ensayos f (x) 5
prob. éxito f (x) 0.10
acumulado f (x) VERDADERO
Dist. Binomial VALOR 0,0729
ensayos f (x) 5
prob. éxito f (x) 0.10
acumulado f (x) FALSO
Como se puede observar, si se escribe verdadero calcula la probabilidad acumulada, al

poner falso calcula la probabilidad puntual.
• La distribución binomial es válida si :
Población
Finita Infinita
Muestreo con Muestreo sin

reposición reposición
Tamaño de la muestra
inferior al 10% del tamaño
de la población
( n/N < 0,1 )
 Ejercicios
1.- Se conoce que el 20% de las cuentas de un Banco tienen saldos superiores a $2.000.
Suponga que se eligen 10 cuentas al azar de las muchas cuentas que tiene el Banco.
Calcule la probabilidad de que:
a ) dos cuentas tengan saldos superiores a $2.000
b ) a lo sumo dos cuentas tengan saldos superiores a $2.000
c ) por lo menos dos cuentas tengan saldos superiores a $2.000
d ) a lo sumo dos cuentas tengan saldos inferiores a $2.000
4.3.2 DISTRIBUCION HIPERGEOMETRICA
La distribución binomial no se usa en situaciones en las que la población es finita, el

muestreo se realiza sin reposición y el tamaño de la muestra es superior al 10% del tamaño
de la población. En estos casos la distribución que se aplica es la distribución
hipergeométrica.
Sea X: nº de éxitos en n repeticiones.
X ∼ Hip.( N , r , n )
C r , x C N − r , n− x
P (X = x ) =
CN ,n
donde:
N = tamaño de la población
n = tamaño de la muestra
r = número de éxitos en la población
x = número de éxitos en una muestra para los cuales se calcula la probabilidad
C = combinaciones
Nota: C N , n es una forma de indicar las combinaciones de N elementos de los cuales se

seleccionan n de los mismos.
Ejemplo
En una reunión hay ocho personas de las cuales 4 son miembros de un sindicato. Se
seleccionan al azar tres personas para formar un comité. ¿Cuál es la probabilidad de que
exactamente una de ellas sea miembro de un sindicato?
Como la población es pequeña y la muestra debe hacerse sin reemplazo, no resulta

apropiada la distribución binomial de allí que se usa la distribución hipergeométrica con
los siguientes parámetros:
N = 8 , n = 3 , r = 4 , x = 1; es decir X ∼ Hip. ( 8,4,3 )
X : nº de personas miembros del sindicato en una muestra de 3.
y la probabilidad pedida será:
C 4,1 C 4,2
P(X=1) = = 0,429
C 8,3
Se demuestra que:
E(X) = n.p siendo p= r

N
N- n
V ( X ) = n . p . (1- p )
N -1
• CALCULO DE PROBABILIDADES HIPERGEOMETRICAS
Utilizando EXCEL en Funciones estadísticas el cálculo de las probabilidades

hipergeométricas se presenta de la siguiente forma :
Dist. Hipergeométrica VALOR 0.42851429
muestra f (x) 3
prob. éxito f (x) 4
población f (x) 8
 Ejercicios
1.- La seccional A de un determinado sindicato tiene 25 miembros. Quince están a favor de

la huelga y 10 no. Se eligen al azar 6 trabajadores. Calcule la probabilidad de que 2
estén a favor de la huelga.
2.-¿Cuál es la probabilidad de que una auditoría bancaria detecte solamente 2 cuentas
especiales con irregularidades, si se seleccionan al azar 6 de las 18 cuentas existentes, 8
de las cuales tienen irregularidades ?
4.3.3 DISTRIBUCION DE POISSON
La distribución de Poisson se usa para modelizar situaciones en las que hay ocurrencias
aleatorias de sucesos por unidad de espacio o tiempo y en donde se desea conocer la
probabilidad de un número específico de éxitos.
Numerosos fenómenos discretos se representan mediante un proceso de Poisson.
Se dice que existe un Proceso de Poisson si al considerar un experimento en el que se
observa la aparición de sucesos puntuales en un intervalo contínuo (de tiempo, longitud,
área, etc.), en cualquier intervalo suficientemente pequeño del intervalo continuo, se verifica
que:
1.- La probabilidad de observar exactamente un éxito en el intervalo es estable

2.- La probabilidad de observar exactamente más de un éxito en el intervalo dado, es 0
3.- La ocurrencia de un éxito en cualquier intervalo es estadísticamente independiente de
aquella en cualquier otro intervalo.
Se define X : número de éxitos en un intervalo.
La fórmula para la distribución de Poisson es:
λ x e− λ
P ( X= x ) = X ∼ Po ( λ )
x!
Distribución de probabilidad de una variable discreta X de Poisson
donde λ es el número promedio de ocurrencias por unidad de tiempo o espacio.

x es el número de ocurrencias cuya probabilidad se desea conocer
e base de los logaritmos naturales
La fórmula de la distribución de Poisson muestra que la misma describe una variable

aleatoria discreta que puede tomar cualquier valor de una sucesión infinita (x = 0, 1, 2, ……
…)
Puede demostrarse que:
∞
e− λ .λ k
E ( X) = ∑ k = λ
k= 0 k!
V ( X) = ( )
E X 2 − [ E ( X) ] 2 = λ
EJEMPLO
Para comprender mejor el proceso de Poisson, supóngase que se analiza la variable
número de clientes que llegan a un banco entre las 12 y 13 hs. Cualquier llegada de un
cliente es un evento discreto en un punto particular sobre el intervalo continuo de 1 hora.
Durante tal intervalo de tiempo puede haber un promedio de 180 llegadas.
Para responder cuál es la probabilidad de que en un minuto lleguen exactamente dos
clientes, es necesario conocer el número promedio de clientes en un minuto. Si el número
promedio de llegadas en una hora es 180, en un minuto será igual a 3 (180 : 60), luego:
32 e − 3
P ( X = 2) = = 0,224 siendo X = nº de personas que llegan al banco en 1’
2!
Si hubiéramos estado interesados en el nº de personas que llegan al banco en un

intervalo de 4’, se debe considerar un promedio de llegadas igual a 4. λ = 4 . 3 = 12.
En general, se escribe:
Xt : número de éxitos en un intervalo t

Xt ∼ Po (λt )
P ( Xt = x ) =
(λ t) xe− λ t
x!
En el ejemplo X t = nº de personas que llegan al banco en t’

Xt ∼ Po (3t )
X4 ∼ Po (12 )
• CALCULO DE LAS PROBABILIDADES DE POISSON
Lo mismo que lo visto para la distribución binomial, para calcular las probabilidades de
Poisson se dispone de tablas estadísticas tabuladas para distintos valores de λ (ver
apéndice 2, tablas 2.2 y 2.3), de softwares estadísticos y planillas de cálculos.
Ejemplo
Una compañía telefónica observa que entran en promedio 3,2 llamadas por minuto en
una línea determinada. Suponiendo que el número de llamadas se distribuye según un
modelo de Poisson, se puede plantear el cálculo de las siguientes probabilidades para
el intervalo de un minuto:
a ) probabilidad de que entren exactamente 2 llamadas
b ) probabilidad de que entren a lo sumo tres llamadas
c ) probabilidad de que entren por lo menos tres llamadas

d ) probabilidad de que entren entre 2 y 7 llamadas ( incluidos estos valores )
a) Usando la tabla de probabilidades acumuladas (tabla 2.3 del apéndice 2), la

probabilidad puntual se puede obtener por diferencia de probabilidades acumuladas.
Así:
P ( X = 2 ) = P ( X ≤ 2 ) - P ( X ≤ 1 ) = 0,38 - 0,171 = 0,209
b) P ( X ≤ 3 ) = 0,603
c) P ( X ≥ 3 ) = 1 - P ( X ≤ 2 ) = 1 - 0,38 = 0,62
d) P ( 2 ≤ X ≤ 7 ) = P ( X ≤ 7 ) - P ( X ≤ 1 ) = 0,983 - 0,171 = 0,812
Utilizando EXCEL en Funciones estadísticas el cálculo de las probabilidades de Poisson se

presenta de la siguiente forma:
POISSON VALOR 0.379903741
x f (x) 2
media f (x) 3,2
acumulado f (x) VERDADERO
POISSON VALOR 0,208702484
x f (x) 2
media f (x) 3,2
acumulado f (x) FALSO
Como se puede observar si se escribe verdadero calcula la probabilidad acumulada, al

poner falso calcula la probabilidad puntual
 Ejercicios
1.- A un muelle de carga llegan camiones en forma aleatoria con un promedio de 1 por
hora. ¿cuál es la probabilidad de que en una hora no llegue ningún camión al muelle?
2.- Una casa de créditos recibe en promedio 2,2 solicitudes de préstamos para
mejoramiento de la vivienda por semana. Calcule la probabilidad de que en una semana:
a) lleguen tres solicitudes de crédito
b) llegue por lo menos una solicitud
c) lleguen entre 2 y 5 solicitudes (incluidos estos valores)
d) lleguen a lo sumo tres solicitudes
3.- La llegada de vehículos a un puesto de peaje sigue un proceso de Poisson con promedio
4 llegadas por minuto. Calcule la probabilidad de que en dos minutos lleguen por lo
menos tres vehículos al puesto de peaje.
4.- El número de averías semanales de una computadora es una variable aleatoria que tiene
distribución de Poisson con promedio λ = 0,4. ¿Cuál es la probabilidad de que la
computadora trabaje sin averías durante dos semanas consecutivas?
• APROXIMACION DE POISSON A LA BINOMIAL
En problemas de distribución binomial donde n es grande y la probabilidad de éxito p es

muy pequeña (o muy grande), se puede demostrar que la distribución binomial se acerca
a una distribución de Poisson.
Como regla empírica, el uso de la distribución de Poisson es apropiado cuando n > 20 y
np ≤ 5 o n.(1 - p) ≤ 5. (En el apéndice 2 se muestra el gráfico de aproximaciones a la
binomial).
Es decir, si X es una variable distribuida binomialmente con parámetro p (con base en n

repeticiones independientes del experimento). Esto es:
 n
P ( X = k) =   pk ( 1− p ) n− k
 k
y n → ∞ , np = λ (constante) , o equivalente: cuando n → ∞ , p → 0 tal que np → λ ;

bajo estas condiciones se tiene :
e− λ λ k
lim P ( X = k ) = la distribución de Poisson con parámetro λ.
n→ ∞ k!
EJEMPLO
Un 1% de los empleados de una fábrica se ausentan diariamente del trabajo. Si se
eligen 70 empleados al azar, ¿cuál es la probabilidad de que sólo 1 esté ausente?
X = nº de empleados ausentes en un total de 70 X ∼ Bi (70 ; 0,01)
P ( X = 1 ) = 0,35
Como n es grande y p chico se puede utilizar la aproximación de Poisson de la

siguiente forma:
λ = np = 70 . 0,01 = 0,7
y usando la tabla de Poisson, la probabilidad pedida es 0,347
A continuación se verán algunas de las distribuciones de variable aleatoria

continua de mayor aplicación:
4.3.4 DISTRIBUCIÓN UNIFORME
La distribución uniforme describe una variable aleatoria que tiene igual probabilidad de
ocurrir en subintervalos de igual tamaño, dentro del campo de definición de la misma.
La siguiente figura muestra una distribución uniforme. El intervalo en el que está definida la
variable aleatoria es (a, b). La “curva” de probabilidad tiene una altura uniforme en todos
los puntos entre a y b.
f (x)
1
b− a
a c d b X
El área del rectángulo es igual a 1, de allí:
1
si x ∈ [ a, b]
b− a
f ( x) =
0 en otro caso
La probabilidad de que la variable caiga entre cualesquiera dos puntos c y d (véase la

figura) es igual a:
d
1 d− c
P ( c ≤ X ≤ d) = ∫ dx =
c b− a b− a
Se demuestra que:
b
a+ b
E (X) = ∫ x f ( x ) dx =
a
2
σ 2
(X) = E ( X ) − [ E ( X )] =
2 2 ( b − a) 2
12
• CALCULO DE PROBABILIDADES UNIFORMES
Ejemplo :
Se sabe que en una empresa, los años de experiencia de los trabajadores de planta
tienen una distribución uniforme con un mínimo de 0 y un máximo de 12,5 años. Se
elige un empleado al azar. Determine la probabilidad de que esta persona tenga entre
2,5 y 7,5 años de experiencia en la compañía.
La variable aleatoria uniforme se presenta escribiendo:
X : años de experiencia de un trabajador

1
X ∼ U ( 0 ; 12,5 ) ⇒ f ( x) =
12.5
0,08
0
2,5 7,5
0 12,5
años de experiencia
7,5 1 7,5 − 2,5 5

P ( 2,5 < X < 7,5 ) = ∫ dx = = = 0,4
2,5 12,5 12,5 − 0 12,5
Hay un 40 % de probabilidad de que un empleado de la compañía elegido al azar tenga

entre 2.5 y 7.5 años de experiencia.
El promedio y la desviación estándar son:
0 + 12,5
E ( x) = = 6,25 años
2
σ (x ) =
(12,5 − 0) 2 = 3,61 años
12
La distribución de los años de experiencia en una empresa para los trabajadores de planta tiene un
promedio de 6,25 años y una desviación estándar de 3,61 años
 Ejercicios
1. El tiempo total necesario para procesar una solicitud de préstamo hipotecario en un banco
sigue una distribución uniforme entre 5 y 9 días.
a) ¿Cuál es el tiempo promedio para procesar un préstamo?

b) ¿Cuál es la desviación estándar del tiempo de procesamiento de préstamos?
c) Determine la probabilidad de que un préstamo tarde más de seis días en ser
procesado.
d) ¿Cuál es el porcentaje de préstamos procesados en a lo sumo ocho días?
2.- Un semáforo está programado para cambiar de rojo a verde según una distribución
uniforme con una media de 45 segundos. La diferencia entre el menor y el mayor número
de segundos que tarda la luz en cambiar es de 8 segundos.
a) Calcule la desviación estándar de esta distribución.
b) Calcule la probabilidad de que la luz tarde por lo menos 43 segundos en cambiar.
c) ¿Cuál es la probabilidad de que tarde menos de 43 segundos en cambiar?
4.3.5 DISTRIBUCIÓN NORMAL
Muchas observaciones de la vida real se pueden modelizar usando la distribución normal. Si

la situación real satisface las condiciones de este importante modelo, se pueden encontrar
respuestas valiosas sin necesidad de dedicar demasiado tiempo a costosas observaciones.
Son tres las razones por las que la distribución normal es la distribución teórica más
importante en la estadística:
 La distribución normal se aproxima a las distribuciones de frecuencias observadas de
muchas medidas naturales y físicas, como coeficientes mentales, pesos, alturas, ventas,
vida útil de productos, variabilidad en la producción humana y de las máquinas, etc.
 La distribución normal se puede usar para aproximar las probabilidades binomiales, de
Poisson, etc., cuando sus parámetros matemáticos alcanzan determinados valores.
 La distribución normal es una buena aproximación de la distribución de una variable

suma de otras variables aleatorias independientes (por ejemplo: medias muestrales,
proporciones muestrales, etc); conceptos muy importantes en estadística que se verán
más adelante (capítulo 5).
La distribución normal es una distribución continua que tiene forma de campana simétrica
y está determinada por su promedio y su desviación estándar.
La siguiente figura muestra la forma de una distribución normal. La misma tiende a infinito
en ambas direcciones a partir de su promedio.
Esto se corresponde con una probabilidad decreciente de encontrar valores de la

característica en estudio mientras más alejados del promedio éstos se encuentren.
El área total bajo la curva es igual a 1. El 50% del área está a la derecha del promedio y el
otro 50% a la izquierda del mismo (en consecuencia, promedio, mediana y moda son eje de
simetría de la distribución).
La función de densidad de probabilidad para la distribución normal es:
2
− 1  x− µ 
 
1 2  σ 
f ( x) = e
σ 2π
donde x = cualquier valor de la variable aleatoria continua

µ = promedio de la variable aleatoria normal
σ = desviación estándar de la variable aleatoria normal
Se puede presentar la variable aleatoria normal escribiendo: X ∼ N ( µ , σ )
Si el promedio y la desviación estándar se conocen, la curva normal queda especificada y

se pueden encontrar las probabilidades. La probabilidad de que una variable aleatoria tenga
un valor entre dos puntos cualesquiera es igual al área bajo la curva entre esos puntos.
 Ejercicios
1. ¿Cuáles de los siguientes enunciados son verdaderos? Justifique su respuesta.

a) La distribución normal es asimétrica.
b) Es necesario conocer la esperanza matemática y la desviación estándar para definir
una distribución normal específica.
c) Cada combinación de promedio y desviación estándar define una distribución normal
única.
d) La distribución normal se mide en una escala discreta.
e) La distribución normal se extiende al infinito en cualquier dirección a partir de la
media.
f) El área total bajo la curva es igual a 1.
g) La probabilidad de que una variable normal tome un valor determinado es distinta de
cero.
2. Analice las distribuciones que se presentan en las figuras siguientes. En cada caso
especifique la relación entre sus parámetros:
AREAS BAJO LA CURVA NORMAL
Para encontrar el área bajo la curva normal debe integrarse su función de densidad, siendo
el cálculo muy complejo. Por otra parte, para disponer de una tabla de áreas bajo esta
curva, serían necesarias más de una, ya que el número de distribuciones normales es
ilimitado, debiendo corresponder una por cada combinación de media y desviación estándar.
Esta situación se puede resolver transformando todas las distribuciones normales en la
distribución normal estándar.
Una variable cualquiera X se estandariza (como se presentó en el ejercicio 2, pag. 77) al

definir:
X− µ
Z= con E( Z ) = 0 y σ (Z) = 1
σ
Cualquier distribución normal se puede convertir en una distribución estándar si se

estandariza cada una de sus observaciones en términos de valores z:
x− µ
z=
σ
La distribución normal estándar es aquella cuya variable aleatoria Z siempre

tiene una media µ = 0 y desviación estándar σ = 1.
La variable Z es una transformación lineal de X. Mientras el promedio y la desviación

estándar de una variable normal general X pueden adoptar cualquier valor, la variable
normal estándar Z es única, con promedio 0 y desviación estándar 1.
Una vez que se ha realizado la estandarización de la distribución, las probabilidades
asociadas a los sucesos de interés se buscan en la tabla de probabilidades para la N(0,1).
Las tabla normal estándar (ver Apéndice tabla 2.4) da las probabilidades acumuladas o
áreas bajo la curva normal, para distintos valores de Z. El ejemplo siguiente permitirá
visualizar esta operatoria.
Ejemplos:
1. Una variable normal tiene esperanza matemática igual a 75 y una desviación estándar
igual a 6 (se expresa: X ∼ N (75,6). En la figura siguiente se observa que cada valor de la
variable X tiene un valor correspondiente en la variable Z.
 Supongamos que quisiéramos conocer la probabilidad de que la variable X tome valores

menores que 81, luego:
 81 - 75 
P ( X < 81 ) = P  Z <  = P ( Z < 1 ) = 0,8413
 6 
Los sucesos ( X < 81 ) y ( Z < 1 ) son sucesos equivalentes y por lo tanto tienen la misma
probabilidad. Después de calcular el valor z para la distribución normal estándar, el
siguiente paso es usar la tabla normal estándar para buscar la probabilidad planteada. El
valor 0,8413 de la probabilidad se obtiene de dicha tabla.
La figura siguiente describe la probabilidad buscada
 La probabilidad del suceso complementario del anterior se obtiene:
P ( X > 81 ) = 1 − P ( X < 81) = 1 − 0,8413 = 0,1587
 La probabilidad de que la variable tome valores entre 69 y 81:
 81 - 75   69 - 75 
P ( 69 < X < 81) = P  Z <  - P Z< =
 6   6 
= P ( Z < 1 ) - P ( Z < - 1 ) = 0.8413 - 0,1587 = 0,6826
2. Una variable normal tiene esperanza matemática igual a 500 y una desviación estándar
igual a 25. Se desea conocer la probabilidad de que la variable tome valores:
a) menores que 535
b) menores que 480
c) mayores que 558
d) mayores que 371
e) entre 461 y 539
 535 - 500 
a ) P ( X < 535 ) = P  Z <  = P ( Z < 1,4 ) = 0.9192
 25 
 480 - 500 
b) P ( X < 480 ) = P  Z <  = P ( Z < - 0 ,8 ) = 0.2119
 25 
 558 - 500 
c) P ( X > 558 ) = P  Z >  = P ( Z > 2 ,32 ) = 1 - 0 ,9898 = 0 ,0102
 25 
 371 - 500 
d ) P ( X > 371 ) = P  Z >  = P ( Z > - 5,16 ) = 1
 25 
 539 - 500   461 - 500 

e) P ( 461 < X < 539 ) = P  Z <  - P Z < =
 25   25 
= P ( Z < 1,56 ) - P ( Z < - 1,56 ) = 0.9406 - 0,0594 = 0 ,8812
ó = 2 P (Z < 1,56 ) - 1 = 2 * 0.9406 - 1 = 0,8812
Utilizando EXCEL en Funciones estadísticas, el cálculo de las probabilidades normales se

presenta de la siguiente forma:
 Si se usa distribución normal estándar:
Distribución normal estándar

z 1.4
Resultado 0.919243289
 Si se usa distribución normal:

Distribución normal
535
x
media 500
desvío estándar 25
acumulado VERDADERO
Resultado 0.919243289
3. Se sabe que el tiempo de almacenamiento de los artículos sigue una distribución normal
con promedio 5 semanas y desviación estándar 4 semanas. ¿Cuál es la probabilidad
de que un artículo elegido al azar haya estado almacenado entre 2 y 10 semanas?.
X: tiempo de almacenamiento de un artículo X ∼ N ( µ , σ ) = N ( 5; 4 )
P ( 2 < X < 10 ) = P ( − 0,75 < Z < 1,25 ) = P ( Z < 1,25) − P ( Z < − 0,75 ) =
= 0,8944 – 0,2266 = 0,6678
Existe una probabilidad igual a 0,6678 de que el artículo elegido al azar tenga un tiempo
de almacenamiento entre 2 y 10 semanas.
4. Qué porcentaje de los valores de una curva normal están entre el promedio ± 1
desviación estándar, ± 2 desviaciones estándar, ± 3 desviaciones estándar ?
En general, para X ∼ N(µ , σ)
P( X − µ < k σ ) = P( µ − kσ < X < µ + kσ )= P(-k < Z < k) = 2 P ( Z < k ) -1
k Probabilidad
1 0.6827
2 0.9545
3 0.9973
Esto quiere decir que, si se analiza el caso particular de una variable normal
estandarizada, casi la totalidad de las observaciones están en el intervalo (-3 , 3); siendo
muy poco probables los valores de la variable fuera del mismo ( 0,27 % ); lo que justifica
el rango de valores z para el que está tabulada.
Observación: asociar con la regla empírica (capítulo 2, pag. 33 ).
 Ejercicios
1.- Una variable aleatoria normal tiene una media de 4.9 y una desviación estándar de 1,2.
a) ¿Cuál es la probabilidad de que la variable tome un valor menor que 5,5?
b) ¿Cuál es la probabilidad de que la variable tome un valor comprendido entre la
esperanza y 6,1?
c) ¿Qué porcentaje del área bajo esta curva es mayor que 6?
2.- Las calificaciones de una prueba siguen una distribución normal con µ = 100. Cuál debe
ser el valor del desvío estándar si se desea que una persona obtenga una calificación
superior a 122,56 con probabilidad 0,08?
• APROXIMACION NORMAL
A LA DISTRIBUCIÓN BINOMIAL
⇒ como se mencionó en el punto 4.3.3 (pag. 86), si en la distribución binomial, el número

de repeticiones n es grande y p pequeño, las probabilidades binomiales se pueden
calcular en forma aproximada a través de la distribución de Poisson (en la práctica,
cuando n > 20 y np ≤ 5 ó n ( 1 - p ) ≤ 5).
⇒ si el número de repeticiones n es grande, y p un valor cercano a 0.5, entonces la curva

normal proporciona una buena aproximación a la distribución binomial, (como regla
empírica esta aproximación es apropiada si np > 5) :
se aproxima por N ( µ = np ; σ = npq )
En el apéndice 2 se muestra el gráfico de aproximaciones de la Binomial con Poisson y

Normal.
A LA DISTRIBUCIÓN DE POISSON
⇒ Si X ∼ Po (λ) y λ toma valores grandes (en la práctica λ > 25), entonces la curva
normal proporciona una buena aproximación a la distribución de Poisson.
se aproxima por N ( µ = λ ; σ = λ )
• FACTOR DE CORRECCIÓN POR CONTINUIDAD
Cuando se aproxima una distribución de probabilidad de una variable aleatoria discreta

(Binomial, Poisson) a la distribución normal (variable aleatoria continua), se hace
necesario realizar la corrección por continuidad, asignando intervalos a la distribución
continua para representar a los valores discretos.
Ejemplo: PB ( X = 30) = PN ( 29,5 < X < 30,5 )
 Ejercicios
1. Un vendedor tiene 30 % de probabilidad de concretar una venta con cualquier cliente

que llama. Si hace 110 llamadas durante un mes dado, determine la probabilidad de que
concrete:
a. a lo sumo 40 ventas.
b. al menos 30 ventas.
2. El gerente de un restaurante ha estado estudiando si los clientes nuevos regresan en el

lapso de un mes. Los datos recogidos revelan que el 60% de los clientes nuevos han
regresado. Si llegan 90 clientes nuevos a cenar al restaurante este mes, determine la
probabilidad de que al menos 50 regresen al mes siguiente.
3. El número de llamadas telefónicas que llegan a un conmutador sigue una ley de Poisson
con promedio 15 llamadas por minuto. Calcule la probabilidad de que en 5 minutos
lleguen a lo sumo 90 llamadas.
• VERIFICACIÓN DE LA NORMALIDAD
Un punto importante a resolver es saber si el fenómeno aleatorio de interés puede

describirse mediante alguno de los modelos probabilísticos conocidos.
Supóngase que hemos recolectado algunos datos referentes a una variable de interés. Nos
gustaría ver si la distribución normal sirve como un buen modelo. Para decidir sobre la
bondad del ajuste podemos:
1. Evaluar las propiedades de la normal
 Mirar un histograma o un diagrama de tallos y hojas buscando característica de falta

de normalidad como por ejemplo: celdas vacías, outliers o una pronunciada asimetría.
 Comparar nuestras observaciones con la regla 68-95-99,7 de la distribución normal.

Calcular la media muestral, x , y el desvío estándar muestral, s, y observar si:
(
aproximadamente el 68 % de las observaciones cae en el intervalo x − s , x + s )
aproximadamente el 95 % de las observaciones cae en el intervalo ( x − 2s , x + 2 s )
aproximadamente el 99,7 % de las observaciones cae en el intervalo ( x − 3s , x + 3s )
2. Hacer gráficos de probabilidad normal
Son gráficos bidimensionales de los valores de los datos observados en el eje vertical con
los valores de las fractilas correspondientes de una distribución normal estándar en el eje
horizontal.
Si los datos graficados caen en o cerca de una línea recta imaginaria creciente desde la
esquina inferior izquierda hacia la esquina superior derecha, entonces el conjunto de
datos tiene una distribución normal (o por lo menos se aproxima).
A continuación se presenta el diagrama de probabilidad normal para el ejemplo de la
variable continua superficie cubierta de la vivienda (en m2) presentada en el capítulo 2,
pag. 16.
SUPERFICIE CUBIERTA
160
140 Como se
Superficie cubierta
puede
120
observar,
100
los datos
pueden
80
60
-3 -2 -1 0 1 2 3
Valores Z
considerarse como provenientes de una distribución normal.1
De acuerdo a la forma que adoptan los datos se concluye con respecto al tipo de
distribución que tiene la población de donde provienen.
4.3.6 DISTRIBUCIÓN EXPONENCIAL
En el ejemplo de la pag. 83 se definió la variable aleatoria de Poisson: número de clientes

que llegan a un banco entre las 12 y 13 hs. Otra variable de interés puede ser el tiempo
entre dos llegadas sucesivas. Interesa conocer su distribución.
Sea la variable aleatoria T: tiempo entre dos llegadas sucesivas a un banco.
La distribución de T puede obtenerse a partir de conocer la distribución del número de

clientes que llegan al banco. Por ejemplo: si interesa conocer la probabilidad de que el
tiempo entre dos llegadas sucesivas sea mayor que t minutos, ésta podrá derivarse de la
distribución de probabilidad de Xt : nº de clientes que llegan al banco en t minutos.
La clave para obtener esta relación es el siguiente concepto: el tiempo entre dos llegadas
sucesivas es mayor que t, si y sólo si no hay llegadas en esos t minutos. Es decir:
1
Ver archivo xls: “Gráfico de probabilidad normal” en ar.groups.yahoo.com/group/probabilidadyestadístca_isi
e − λ t (λ t ) 0
P ( T ≥ t ) = P ( Xt = 0 ) = = e− λ t
0!
Luego:
P (T ≤ t ) = 1 - P ( T ≥ t ) = 1 - e - λ t
F( t ) = 1 - e- λ t
d F( t )
= λ e- λ t = f (t)
dt
Se obtuvo la función de densidad de T, que es una variable aleatoria continua con

distribución exponencial. La obtención de la distribución de T depende sólo de la hipótesis
de que el número de llegadas sigue un proceso de Poisson.
EJEMPLO
Interesa conocer la probabilidad de que el tiempo entre dos llegadas sucesivas a un
banco sea mayor que 1 minuto.
X1 ∼ Po (λ = 3)
e − 3 .3 0
P ( T > 1) = P (X1 = 0 ) = = e − 3 = 0,0498
0!
Formalizando se dice que una variable aleatoria continua X tiene distribución exponencial si:
 -λ x
f (x) =  λ e x ≥ 0
 0 en otro caso
Si la variable aleatoria X tiene una distribución exponencial con parámetro α , entonces
1 1
E ( X) = y V( X ) =
λ λ2
• CALCULO DE PROBABILIDADES
Para el ejemplo planteado anteriormente, consideramos:
X : tiempo entre dos llegadas sucesivas a un banco X ∼ Exp ( 3 minutos-1)
1
P ( X < 1 ) = 3 ∫ e − 3x dx = 1 − e − 3 = 0,9502
0
Utilizando EXCEL en funciones estadísticas, el cálculo de las probabilidades se presenta de

la siguiente forma:
DIST. EXP.
X
1
LAMBDA 3
ACUMULADO VERDADERO
VALOR = 0,950212932
EJEMPLO
1. En una red de computadoras, el acceso de los usuarios al sistema se comporta como un
proceso de Poisson con un promedio de 25,2 accesos por hora.
a) ¿Cuál es la probabilidad de que el tiempo entre dos accesos sucesivos sea superior a
seis minutos?
Sea Yt: número de accesos al sistema en t minutos. Yt ∼ Po ( λt )
Se conoce Y60 ∼ Po (25,2 acc/1 hora)

 25,2 
en consecuencia Y1’ ∼ Po  = 0,42 acc / 1 min  .
 60 
Sea X : tiempo entre dos accesos sucesivos X ∼ Exp ( 0,42 minutos –1)
P ( X > 6 ) = e - 0,42 * 6 = 0,0805
b) ¿Cuál es la probabilidad de que el tiempo que transcurre hasta el siguiente acceso

esté entre 2 y 3 minutos?
P (2 < X < 3) = F (3) – F (2) = (1 – e-0,42*3) – (1 - e-0,42*2) = e -0,42*2 - e-0,42*3 = 0,43 – 0,28 =
0,15
 Ejercicios
1. El tiempo entre llegadas de taxis a una parada tiene una distribución exponencial con
promedio 10 minutos.
¿Cuál es la probabilidad de que una persona que esté en el cruce tenga que esperar más
de una hora para tomar un taxi?
2. Demuestre que si X ∼ Exp ( λ ) →

P ( X > s + t / X > s ) = P ( X > t ) para cualquier s,t > 0.
(Propiedad de no memoria)
4.3.7. EJERCICIOS RESUELTOS
1.- La sección Control de Calidad de una industria manufacturera realiza un muestreo de

aceptación de los lotes que recibe, con el siguiente criterio: de cada lote inspecciona
muestras de cinco unidades, si entre ellas encuentra una o más defectuosas rechaza el
lote, caso contrario lo acepta. Si el 5 % del lote es defectuoso, ¿cuál es la probabilidad de
que sea rechazado?
Solución:
Sea X: número de unidades defectuosas en un total de 5
Al ser la muestra pequeña con respecto al tamaño de la población y a pesar de que el

muestreo se hace sin reposición se puede decir que : X ∼ Bi ( n , p ) = Bi ( 5 , 0,05 )
El lote es rechazado si hay una o más unidades defectuosas entre las cinco observadas,
es decir, la probabilidad de que el lote sea rechazado es equivalente a:
P ( X ≥ 1 ) = 1 - P ( X = 0 ) = 1 - 0,7738 = 0,2262
2.- El Sr. García es el responsable de la compra de cajas de vino para un restaurante.

Periódicamente elige una caja de prueba (12 botellas por caja) para determinar si el
proceso de sellado es adecuado. Para esta prueba, selecciona al azar 4 botellas de la
caja para catar el vino. Si una caja contiene dos botellas de vino en mal estado, calcule la
probabilidad de que precisamente una de ellas aparezca en la muestra del Sr. García.
Solución:
X : número de botellas en mal estado

X ∼ Hiperg ( N , r , n ) = Hiperg ( 12 , 2 , 4 )
C 2,1 C 10 , 3
P(X=1) = = 0,485
C 12 , 4
3.- La comisión de desarrollo económico de una ciudad ha determinado que el número de

pequeños negocios que se declaran en quiebra al mes es un proceso de Poisson con
promedio 2,6. Calcule la probabilidad de que:
a) Ninguno se declare en quiebra el próximo mes
b) Tres se declaren en quiebra el próximo mes
c) Ocurran menos de tres quiebras el siguiente mes

d) Uno o más negocios se declaren en quiebra el próximo mes
e) Ocurran dos quiebras durante los próximos dos meses
Solución:
Sea: Xt : número de quiebras de pequeños negocios en t meses Xt ∼ Po ( λ t )
X1 ∼ Po ( 2,6 ) X2 ∼ Po (2,6 * 2 = 5,2)
a) P ( X1 = 0 ) = 0,0743
b) P ( X1 = 3 ) = 0,2176
c) P ( X1 < 3 ) = 0,5184
d) P ( X1 ≥ 1 ) = 1 - P ( X1 = 0 ) = 1 - 0,0743 = 0,9257
e) P ( X2 = 2 ) = 0,0746
4.- El tiempo de vuelo entre dos ciudades de una aerolínea sigue una distribución uniforme
entre 80 y 100 minutos.
a) ¿Cuál es el tiempo de vuelo promedio entre las dos ciudades?

b) ¿Qué porcentaje de vuelos puede esperarse que tarden entre 85 y 95 minutos?
c) Un servicio aéreo entre las dos ciudades se considera eficiente si por lo menos el 50
% de sus viajes se realiza en menos de 95 minutos. ¿Se puede considerar eficiente
el servicio en esta aerolínea?
X : tiempo de vuelo (en minutos) X ∼ U ( 80 , 100 )
a) E (X) = 80 + 100 = 90 minutos

2
b) P ( 85 < X < 95 ) = 95 - 85 . = 0,5 ⇒ 50 % de los vuelos tardan entre 85 y 95’
100 – 80
c) P ( X < 95 ) = 95 – 80 = 15 = 0,75
100 – 80 20
El 75 % de los vuelos tienen tiempos menores de 90’, por los tanto el servicio se
considera eficiente.
5.- Las primas de riesgos mensuales (en $) de una compañía de seguros siguen una
distribución normal. Se quiere determinar el porcentaje de recibos mensuales que caen
dentro del intervalo de $125 a $175, ya que esas cantidades son difíciles de manejar.
Para determinar el porcentaje de cuentas en este rango, se calcula el promedio y la
desviación estándar de los recibos mensuales de las primas, obteniéndose 100$ y 38$,
respectivamente.
a) ¿Qué porcentaje de recibos mensuales puede esperarse que caiga dentro del rango
de 125 a $175?
b) Se predice que dentro de dos años el promedio mensual de la prima se elevará a
$150. Suponiendo que la desviación estándar permanece igual, ¿en qué cambiaría
este hecho la respuesta al punto a?
X: valor de la prima de riesgo (en $) X ∼ N (100,38)
a) P (125 < X < 175) = P (125 – 100 < Z < 175 – 100) = P (0,66 < Z < 1,97) =
38 38
= F (1,97) – F (0,66) = 0.9756 - 0.7454 = 0.2302
b) X ∼ N ( 150 , 38 )
P (125 < X < 175) = P (125 – 150 < Z < 175 – 150) = P (- 0,66 < Z < 0,66) =
38 38
= 2 * F (0,66) - 1 = 2 * 0.7454 - 1 = 0.4908
Existirá un mayor porcentaje de primas de riesgo con valores en el rango (125, 175) si
µ = 150.
6.- El tiempo que transcurre entre las llamadas a una empresa de artículos para plomería
tiene una distribución exponencial con un tiempo promedio entre llamadas de 12
minutos.
a) ¿Cuál es la probabilidad de que no haya llamadas en un lapso de 1 minuto?

b) ¿Cuál es la probabilidad de recibir al menos una llamada en un intervalo de 10
minutos?
c) ¿Cuál es la probabilidad de recibir la primera llamada entre cinco y 10 minutos
después de abierta la empresa?
d) Determinar la amplitud del intervalo de tiempo, de modo tal que la probabilidad de
recibir al menos una llamada en ese lapso sea 0,80.
X: tiempo entre llamadas E (X) = 12’ → X ∼ Exp (1/ 12)
a) Recordar la relación entre Poisson y exponencial:

1
Si X ∼ Exp ( ) →
12
Y1 = número de llamadas en 1 minuto Y1∼ Po ( λ ) siendo λ = 1/ 12 ≅ 0,08
Luego:
P (Y1 = 0) = e – 0,08 = 0,92
b) Y10 = número de llamadas en 10 minutos Y10 ∼ Po (10 λ) → Y10 ∼ Po (0,8)

P (Y10 ≥ 1) = 1 – P (Y10 = 0) = 1 - e – 0,8
= 0,55
c) Recibir la primer llamada entre 5 y 10 minutos después de abierta la empresa es

equivalente a decir que el tiempo que transcurre entre la apertura y la primer llamada
está en el intervalo (5, 10):
P (5 < X < 10) = e - 0,08 *5 – e - 0,08 *10 = 0,67 – 0,45 = 0, 22
d) Yt = número de llamadas en t minutos Yt ∼ Po (t * 0,08)

P ( Yt ≥ 1) = 0,80
P ( Yt ≥ 1) = 1 – P (Yt = 0 ) = 0,80
P ( Yt = 0 ) = 0,2 ⇒ t λ = t * 0,08 ≅ 1,6 ⇒ t = 1,6 : 0,08 = 20 minutos
4.4 FUNCION DE VARIABLE ALEATORIA
En los siguientes ejemplos se considera una variable aleatoria X, con distribución de

probabilidad conocida y una variable aleatoria Y, función real de X ⇒ Y = H ( X ). Las
probabilidades de sucesos asociados a la variable Y se podrán obtener a partir de la
distribución de probabilidad de X si se determinan los sucesos equivalentes en cuestión.
EJEMPLOS
 X variable aleatoria discreta ; Y variable aleatoria discreta
La probabilidad de que una máquina falle en un día cualquiera es 0,05. Si la máquina no

tiene fallas durante la semana, se obtiene una utilidad S. Si ocurren 1 ó 2 fallas, se
obtiene una utilidad R (R<S). Si ocurren 3 o más fallas, se obtiene una utilidad –L (R, S y
L son positivos). Si la máquina falla cualquier día, permanece fuera de uso durante el
resto del día.
Sea X : número de fallas en 5 días
 n
X ∼ Bi ( n,p ) = Bi ( 5;0,05 ) → P(X = k) =   p k ( 1 − p ) n − k
 k
Y: utilidad obtenida en una semana de cinco días Y = H (X).
La distribución de probabilidad de Y se presenta a continuación:
yi sucesos equivalentes Probabilidad

S X=0 P(Y = S) = P ( X = 0 ) = 0,774
R 1≤X≤2 P(Y = R) = P( 1 ≤ X ≤ 2 ) = 0,225
-L X≥3 P(Y = -L) = P( X ≥ 3 ) = 0,001
1
 X variable aleatoria continua ; Y variable aleatoria discreta
La entrada en un canal de comunicación es una variable aleatoria X distribuida

uniformemente en el intervalo (-2,5 ; 1,5 ).
La salida Y toma los valores: 0 si x > 1

1/2 si -1 ≤ x ≤ 0
1 si 0<x≤1
Sea X : entrada en un canal de comunicación
X ∼ U (a ; b) = U ( -2,5 ; 1,5 ) → f (x) = 1/ 4
Y: salida del canal de comunicación Y = H(X)
A continuación se presenta la distribución de probabilidad de Y:
yi sucesos equivalentes Probabilidad

0 X > 1 ∨ X < -1 P(Y = 0) = P ( X >1) + P ( X <-1) = 0,125 + 0,375 = 0,5
½ -1 ≤ X ≤ 0 P(Y = ½ ) = P(-1 ≤ X ≤ 0 ) = 0,25
1 0< X ≤1 P(Y = 1 ) = P (0 < X ≤ 1 ) = 0,25
1
4.5 EJERCICIOS PROPUESTOS
1.- Una variable aleatoria continua X tiene distribución de probabilidad:

f (x) = 3 x2 0≤ x ≤1
= 0 en otro caso
a) Represente gráficamente f (x).
b) Encuentre promedio, mediana y varianza.
c) Calcule la probabilidad de que X supere 0,75.
2.- La etiqueta en las cajas de una marca de detergente indica un peso de 800 gramos. Una
máquina llena estas cajas donde el contenido de las mismas es una variable aleatoria
uniforme en el intervalo (780;820). El control de calidad acepta las cajas llenas con 15
gramos más o menos de la cantidad que indica la etiqueta.
a) ¿Cuál es la variabilidad del contenido de las cajas?
b) ¿Cuál es la probabilidad de que una caja contenga entre 785 y 795 gramos?
c) ¿Cuál es la probabilidad de que una caja no cumpla con el estándar de control de
calidad?
3.- El número de llamadas telefónicas que llegan a un conmutador es una variable aleatoria
X que se distribuye según una ley de Poisson de parámetro λ = 15 llamadas por minuto.
Según el número de llamadas que lleguen puede ser necesario descongestionar el
conmutador dirigiendo algunas llamadas a líneas auxiliares. Si el número de llamadas es
a lo sumo 15, no se necesita línea auxiliar; si es mayor que 15 pero menor o igual que
25, se necesita una línea; para un número mayor que 25 se utilizan dos líneas auxiliares.
a) Encuentre la distribución de probabilidad de la variable aleatoria Y: número de líneas
auxiliares necesarias en un minuto.
b) Encuentre promedio y desviación estándar de la variable aleatoria Y.
4.- Un artículo puede tener dos defectos D1 y D2. El número de defectos D1 es una variable
aleatoria de Poisson con parámetro λ1 = 0,1 y el número de defectos D2 sigue una
distribución de Poisson con parámetro λ2 = 0,3. Los defectos son independientes. Un
artículo se considera defectuoso cuando presenta al menos uno de los defectos.
Calcule la probabilidad de que en una muestra de 50 artículos haya a lo sumo 10
defectuosos.
5.- Una variable aleatoria X se distribuye uniformemente en [– α ; α] , (α > 0). Cada vez que
sea posible, determine α que satisfaga:
a) P ( X > 1 ) = 1/3
b) P ( X > 1 ) = 1/2
c) P (  X  < 1 ) = P (  X  > 1 )
6.- El número de clientes que llegan a una caja de un supermercado es una variable
aleatoria de Poisson con promedio 10 clientes en 5 minutos. ¿Cuál es la probabilidad de
que transcurran al menos 2 minutos entre dos llegadas sucesivas?
7.- Las mediciones repetidas de una cierta magnitud δ, con una determinada técnica,
permite afirmar que tales medidas tienen distribución normal con promedio µ = –183,2
unidades y σ = 0,08 unidades.
a) ¿Cuál es la probabilidad de que la medición resulte superior a –183?
b) Se realizan 10 mediciones de δ, calcule la probabilidad de que sólo dos de ellas
superen el valor –183.
8.- El tiempo de funcionamiento sin fallas (en años) de un cierto tipo de componente es una
variable aleatoria X con distribución exponencial de parámetro 0,2.
a) Calcule la probabilidad de que una componente no tenga fallas durante los dos
primeros años de funcionamiento.
b) ¿Cuál es la probabilidad de que en un lote de 15 componentes elegidas al azar, por
lo menos 11 componentes no tengan fallas durante los dos primeros años de
funcionamiento?
c) Se sabe de que en un lote de 15 componentes elegidas al azar, por lo menos 11 no
tuvieron fallas durante los dos primeros años. Calcule la probabilidad de que en ese
período, no hayan tenido fallas exactamente 13 componentes.
d) Se arma un lote con cinco componentes elegidas al azar y se las numera del 1 al 5.
¿Cuál es la probabilidad de que sólo las componentes 1 y 2 no tengan fallas durante
los dos primeros años de funcionamiento? (En todos los casos llegar al resultado
numérico).
9.- Una experiencia aleatoria ε tiene dos resultados posibles (A y A ). Se conoce que
P(A) = 0,20.
Calcule la probabilidad de que en 10 repeticiones de la experiencia ε :
a) haya igual cantidad de resultados A y A .
b) la cantidad de resultados A supere la cantidad de resultados A .
c) en la cuarta experiencia ocurra el primer resultado A
d) en las últimas cuatro experiencias ocurran todos los resultados A
10.- El número de accidentes que ocurren diariamente en un cruce de avenidas es una

variable aleatoria con distribución de Poisson con promedio 0,1 accidentes diarios.
Calcule, entre los días en los que hubo más de un accidente, la proporción de días en
los que hayan ocurrido solamente dos.
11.- Una prueba consta de 50 preguntas con cuatro respuestas alternativas dadas de las
cuales sólo una es correcta. Cada pregunta se refiere a un tema específico. Sea “p” la
probabilidad de que un alumno haya estudiado el tema. Se sabe que la probabilidad de
contestar correctamente una pregunta cuando el alumno estudió el tema es 0,9. Si el
alumno no estudió el tema elegirá al azar una de las respuestas alternativas.
a) ¿Cuál debe ser el valor de “p” para que la probabilidad de que un alumno responda
correctamente una pregunta sea 0,8?
b) ¿Cuál es la probabilidad de que el alumno haya estudiado el tema si respondió
correctamente la pregunta?
c) Si se aprueba con el 80% de respuestas correctas, ¿qué porcentaje de alumnos
aprobará?
12.- La demanda semanal de copias de un procesador de textos en un negocio de software

es una variable aleatoria X con la siguiente distribución de probabilidades:
x 0 1 2 3 4 5 6 7 8 9 10
P(X=x) 0,06 0,14 0,16 0,14 0,12 0,10 0,08 0,07 0,06 0,04 0,03
a) Calcule la probabilidad de que en una semana cualquiera se soliciten:

i) tres ó más copias
ii) por lo menos 2 pero no más de 6 copias
b) La política del negocio es tener 8 copias del programa al inicio de cada semana.
¿Cuál es la probabilidad de que, en una semana cualquiera, la demanda supere la
oferta?
c) Encuentre la función de distribución de probabilidad acumulada F(x)
d) Calcule nuevamente las probabilidades del punto a) pero usando la F(x).
e) Calcule el promedio, la varianza y la desviación estándar de la variable aleatoria X
13.- Una compañía de procesamiento de datos tiene una macrocomputadora a la cual se

accede a través de un gran número de terminales remotas. Un modelo razonable de
probabilidad para el tiempo Y (en minutos) transcurrido entre envíos sucesivos de los
trabajos a la computadora supone que:
F (y) = P(Y < y) = 1 – e–0,5y 0≤ y<∞
a) Calcule los valores numéricos de F (y) para y = 1,0; 2,0 ; ...... hasta que F (y)
exceda de 0,98 (aproximadamente)
b) Calcule P( Y < 0,75 ) , P ( Y > 4,0 ) y P ( 2,0 < Y < 3,5 )
c) Encuentre la función de densidad de probabilidad f (y)
14.- Un fabricante de cierto tipo de piezas somete cada unidad a una prueba muy rigurosa.
De las piezas recién ensambladas, el 84% pasa la prueba sin ninguna modificación. Las
que fallan en la prueba inicial son reelaboradas; de éstas, el 75% pasa una segunda
prueba. Aquellas piezas que fallan en la segunda prueba se rehacen por segunda vez y
se vuelven a probar; 90% de ellas pasan la prueba y el resto se desarman. Defina X
como la variable aleatoria: número de veces que debe reprocesarse una pieza
seleccionada al azar.
a) Especifique el recorrido de la variable X
b) Encuentre la distribución de probabilidad de X
c) Encuentre promedio, varianza y desviación estándar de la variable X
15.- El operador de una computadora recibe peticiones imprevistas para montar cintas de
datos en el sistema. Como política, estas solicitudes deben ser atendidas a la brevedad
posible; debido a ello, se tiene que interrumpir el flujo del trabajo programado.
Sea la variable aleatoria X : número de solicitudes recibidas en un turno de 9 a 17 horas.
Se conoce que la variable X sigue una ley de Poisson con promedio 1,5 solicitud por
hora.
a) Encuentre la media y la desviación de la variable X
b) Calcule P( X > 8 )
c) Encuentre la probabilidad de que el tiempo transcurrido entre dos solicitudes
consecutivas sea al menos de dos horas.
16.- En una compañía de redes de cómputo se observa la variable aleatoria X: número de

interrupciones diarias que tiene la siguiente distribución de probabilidades:
Interrupciones 0 1 2 3 4 5 6
P(X=x) 0,32 0,35 0,18 0,08 0,04 0,02 0,01
a) Calcule la probabilidad de en un día dado :

i) haya menos de 4 interrupciones
ii) haya a lo sumo 4 interrupciones
iii) haya por lo menos 4 interrupciones
iv) haya 4 interrupciones
v) haya más de 4 interrupciones
vi) haya entre 2 y 6 interrupciones (incluidos estos valores)
b) Calcule el promedio y la desviación estándar de a variable X. Interprete los
resultados.
17.- En una concesionaria de autos de la marca XX los registros de garantía de un

automóvil nuevo permiten decir que la probabilidad de que un auto nuevo necesite
reparación amparada por la garantía durante los primeros 90 días, es de 0,05. Se
selecciona al azar una muestra de cinco autos nuevos,
a) calcule la probabilidad de que :
i) ninguno necesite reparación amparada por la garantía
ii) por lo menos uno necesite reparación amparada por la garantía
b) encuentre el número promedio de la variable que definió en el punto a)
c) Conteste las mismas preguntas del punto a) y b) si la probabilidad de necesitar una
reparación amparada por la garantía fuera de 0,10.
18.- Los gastos mensuales en alimentación para familias de cuatro miembros en una ciudad
es una variable aleatoria normal con promedio 420$ y desviación estándar 80$.
a) ¿ Qué porcentaje de estos gastos :
i) es menor que 350$?
ii) está entre 250 y 350$?
iii) es menor que 250$ o mayor que 450$?
b) Determine el cuartil 1 y el cuartil 3
c) ¿Cuáles serían sus respuestas al punto a) si la desviación es de 100$?
19.- Se supone que la calificación obtenida en el examen final de un curso introductorio de

estadística es una variable aleatoria con distribución normal con promedio 73 y
desviación estándar 8.
a) ¿Cuál es la probabilidad de obtener en este examen una calificación no mayor de
91?
b) ¿Qué porcentaje de estudiantes obtuvo una calificación entre 65 y 89?
c) ¿Cuál fue la calificación superada sólo por el 5% de los estudiantes que hicieron el
examen?
d) Si el profesor le otorga Promoción al 10% más alto de la clase sin importar la
calificación, ¿le conviene a usted una calificación de 81 con este examen o una
calificación de 68 en un examen diferente en el que el promedio fuera 62 y la

desviación estándar 3?
20.- Una oficina que procesa permisos para remodelación de edificios tiene como política
que el permiso se entregará sin costo si no está listo al final de 5 días hábiles, a partir
de la fecha de la solicitud. Se mide el tiempo de procesamiento a partir del momento
en que se recibe la solicitud hasta completar el procesamiento (Suponga que el tiempo
tiene distribución normal).
a) Si el proceso tiene una media de 3 días y una desviación estándar de 1 día, ¿qué
proporción de los permisos serán gratis?
b) Si el proceso tiene una media de 2 días y una desviación estándar de 1,5 días,
¿qué proporción de los permisos será gratis?
c) ¿En cuál de los dos procesos, (a) ó (b), resultarán más permisos gratis? Explique.
d) Para el proceso del punto (a), ¿sería mejor reducir el promedio a 2 días o la
desviación estándar a 0,75 días? Explique.
21.- El nivel de llenado de unas botellas de refrescos tiene una distribución normal con
media 2 litros y desviación estándar 0,06 litros. Las botellas que contienen menos de
95% del contenido neto anunciado (1,9 en este caso) pueden causar una multa al
fabricante por parte de la oficina de protección al consumidor, mientras que las botellas
que tienen un contenido neto mayor que 2,1 litros pueden provocar un derrame del
exceso al abrirlas.
a) ¿Cuál es la probabilidad de que le pongan una multa al fabricante, si se selecciona al
azar una botella de la producción?
b) ¿Qué proporción de las botellas pueden provocar un derrame al abrirlas?
c) ¿Qué cantidad mínima de refresco se espera que contenga 99% de las botellas?
d) ¿Entre qué dos valores (con distribución simétrica) se espera encontrar el contenido
del 99% de las botellas?
e) Suponga que en un esfuerzo por reducir el número de botellas que contienen menos
de 1,9 litros, el embotellador arregla la máquina de llenado de manera que la media
sea de 2,01 litros. En estas circunstancias, ¿cuáles serían sus respuestas a las
preguntas de los puntos a), b) y c)?
5. VARIABLES ALEATORIAS
DE MAS DIM E NSIO N ES
CONTENIDO
5 VARIABLES ALEATORIAS DE MAS

DIMENSIONES.......................................111
5.1 VARIABLE ALEATORIA BIDIMENSIONAL DISCRETA.......................111
5.1.1 DISTRIBUCION DE PROBABILIDAD PUNTUAL CONJUNTA.111
5.1.2 DISTRIBUCIONES MARGINALES...............................................112
5.2 VARIABLE ALEATORIA BIDIMENSIONAL CONTINUA..................... 113
5.2.1 DISTRIBUCION DE PROBABILIDAD CONJUNTA................... 113
5.2.2 DISTRIBUCIONES MARGINALES...............................................113
5.3 VARIABLES ALEATORIAS INDEPENDIENTES......................................114
5.4 COVARIANZA Y CORRELACION DE VARIABLES ALEATORIAS....115
5.4.1 COVARIANZA............................................................................... 115
5.4.2 COEFICIENTE DE CORRELACION........................................... 115
5.5.1 SUMA DE VARIABLES ALEATORIAS......................................... 117
5.5.2 DIFERENCIA DE VARIABLES ALEATORIAS.............................120
5.6 PROPIEDADES REPRODUCTIVAS............................................................ 120
5.7 TEOREMA CENTRAL DEL LIMITE...........................................................122
5.8 EJERCICIOS PROPUESTOS........................................................................124
VARIABLES ALEATORIAS DE MAS DIMENSIONES 111
5 VARIABLES ALEATORIAS DE MAS DIMENSIONES
El capítulo anterior trató distribuciones de probabilidad para una única variable. Sin embargo
frecuentemente es útil definir en un experimento aleatorio más de una variable aleatoria.
Por ejemplo, en la clasificación de señales transmitidas, puede definirse una variable aleatoria
X como el número de señales de alta calidad recibidas y otra variable Y número de señales de
baja calidad recibidas.
En otro ejemplo, la variable X puede denotar la longitud de una pieza moldeada por inyección
y la variable aleatoria Y puede ser el ancho de la pieza.
En ambos casos el interés recae en probabilidades que pueden expresarse en términos de X e

Y y por lo tanto, el resultado de la experiencia queda definida con dos valores.
Tales situaciones son modelizadas a través del vector aleatorio o variable aleatoria
bidimensional (X , Y).
En el caso de que el resultado de la experiencia quede definido por una n-upla de valores el
modelo será un vector o variable aleatoria n - dimensional.
En general, si (X , Y) es una variable aleatoria bidimensional, el espacio muestral asociado se

indica como Rxy y la distribución de probabilidad que define su comportamiento se conoce
como distribución de probabilidad conjunta.
5.1 VARIABLE ALEATORIA BIDIMENSIONAL DISCRETA
( X , Y ) es una variable bidimensional discreta si R xy es finito o infinito numerable.
5.1.1 DISTRIBUCION DE PROBABILIDAD PUNTUAL CONJUNTA
Ejemplo :
Dos líneas de producción manufacturan un tipo de artículo. La producción, en cualquier día
dado, es de a lo sumo 3 artículos para la línea A y 2 artículos para la línea B.
Sean las variables aleatorias:
X : número de artículos producidos por la línea A
Y : número de artículos producidos por la línea B.

La siguiente tabla da la distribución de probabilidad conjunta de la variable ( X , Y ) :
X
Y 0 1 2 3
0 0,00 0,04 0,06 0, 09
1 0,01 0,04 0,09 0,19
2 0,02 0,08 0,11 0,27
Por ejemplo, 0,27 da la probabilidad de que la línea A produzca 3 artículos y la línea B 2

artículos. Esto se puede escribir de la siguiente forma:
P3 , 2 = P (3 , 2) = P (X = 3 ∩ Y = 2) = P (X = 3 , Y = 2) = 0,27 Probabilidad puntual conjunta
En general:
 Pi j = P ( xi , yj ) = P ( X = xi ∩ Y = yj ) = P ( X = xi , Y = yj )
Los valores pij son tales que:
 pij ≥ 0 ∀i,j
 ∑∑ pij = 1
( condición de cierre )
i j
5.1.2 DISTRIBUCIONES MARGINALES
Volviendo al ejemplo, puede interesar conocer la probabilidad de que en la línea B se

produzcan dos artículos: P ( Y = 2 ).
Para calcularlo se deben sumar las probabilidades de la fila Y = 2 , es decir :
P ( Y = 2 ) = 0,02 + 0,08 + 0,11 + 0,27 = 0,48 .
De igual forma se puede obtener la probabilidad de Y = 0 , Y = 1 que junto con la P ( Y = 2 )

constituyen la distribución de probabilidad marginal de la variable aleatoria Y.
La tabla siguiente da (junto con la distribución de probabilidad conjunta) las distribuciones

marginales de las variables X e Y:
X Probabilidad
0 1 2 3 marginal de Y
Y p. j
0 0,00 0,04 0,06 0,09 0,19
1 0,01 0,04 0,09 0,19 0,33
2 0,02 0,08 0,11 0,27 0,48
Probabilidad
marginal de X 0,03 0,16 0,26 0,55 1,00
p i.
En general

P ( X = xi ) = ∑ p ij = pi.
Distribución de probabilidad marginal de X
j
 P( Y = yj ) = ∑ p ij = p.j Distribución de probabilidad marginal de Y

i
5.2 VARIABLE ALEATORIA BIDIMENSIONAL CONTINUA
( X , Y ) es una variable bidimensional continua si R xy es infinito no numerable.
5.2.1 DISTRIBUCION DE PROBABILIDAD CONJUNTA
Sea ( X , Y ) una variable aleatoria bidimensional continua que toma todos los valores R del
plano. La función de densidad de probabilidad conjunta f ( x , y ) es una función que
satisface las siguientes condiciones :
 f(x,y) ≥ 0 ∀ x , y ε Rxy
+∞ +∞
 ∫ ∫ f (x, y) dx dy = 1 ( condición de cierre )
−∞ −∞
5.2.2 DISTRIBUCIONES MARGINALES
Al igual que en caso discreto a cada una de las variables que forman el vector se le puede
asociar una función que modelice el comportamiento probabilístico de la variable. Así se
obtienen:
+∞
f1 ( x ) = ∫ f (x, y) dy función de densidad de probabilidad marginal de la variable X
−∞
+∞
f2 ( y ) = ∫ f (x, y) dx función de densidad de probabilidad marginal de la variable Y
−∞
Ejemplo :
Sea la variable aleatoria bidimensional continua (X,Y) con función de densidad de
probabilidad
f ( x, y ) = 1 / 4 x y 0<x<2 0<y<2
22
Se verifica la condición de cierre ya que: ∫ ∫ 14 x y dx dy = 1
00
Además las funciones de densidad de probabilidad marginales resultan:
2
f1 ( x ) = ∫ 1 x y dy = 1 x 0
4 2
0
2
f2 ( y ) = ∫ 1 x y dx = 1 y
4 2
0
5.3 VARIABLES ALEATORIAS INDEPENDIENTES
En el capítulo 3 se trabajó con el concepto de independencia entre dos sucesos A y B. De igual

forma, en este capítulo se dará la definición de variables aleatorias independientes.
Dos variables aleatorias, X e Y son independientes si el resultado de una no modifica el

resultado de la otra.
Para hacer más precisa la anterior noción de independencia se dice que dos variables
aleatorias son independientes si:
 P ( X = xi , Y = yj ) = P ( X = xi ) . P ( Y = yj ) (caso discreto)
 f(x,y) = f1(x).f2(y) (caso continuo)
La definición anterior lleva a la siguiente conclusión:
• si la distribución de probabilidad conjunta es conocida siempre se pueden obtener las

marginales
• si se conocen las distribuciones de probabilidad marginales solamente se puede conocer la
conjunta si las variables son independientes.
Ejemplo :
En los dos ejemplos trabajados, uno para variable bidimensional discreta y otro para el
caso continuo. Se analizará si las variables X e Y son o no independientes.
En el caso discreto:
P (X = 3 , Y = 2) = 0,27
P (X = 3) . P (Y = 2) = 0,55 . 0,48 = 0,264
Al ser 0,27 ≠ 0,264 ⇒ X e Y no son independientes.
En el caso continuo:
f ( x , y ) = 1/4 x y
f1 ( x ) . f2 ( y ) = 1/2 x . 1/2 y = 1/4 x y
Al coincidir ambas igualdades ⇒ X e Y son independientes
5.4 COVARIANZA Y CORRELACION DE VARIABLES ALEATORIAS
En la sección anterior se definió la independencia de dos variables aleatorias. En este punto

se considerará los distintos tipos de dependencia que puede haber entre ellas y cómo se
pueden medir.
Son muchos los tipos de dependencia que pueden tener dos variables y muchas las medidas
que se pueden utilizar.
Dos de ellas: la covarianza y el coeficiente de correlación, son particularmente importantes
porque están íntimamente relacionadas con el concepto de varianza de una variable aleatoria.
Ejemplo :
Con respecto al ejemplo de las dos líneas de producción ( A y B ) que manufacturan un tipo
de artículo, en la tabla se observa que existe relación entre X e Y: cuando el número de
unidades producidas por la línea A es mayor, hay más probabilidad de que la línea B
produzca más unidades. En general, los resultados X e Y tienden a variar juntos.
5.4.1 COVARIANZA
Dadas dos variables aleatorias X e Y , la covarianza entre X e Y denotada por Cov ( X , Y ) se

define como :
Cov ( X , Y ) = E { [ ( X - E ( X ) ] [ ( Y - E ( Y )] }
Trabajando algebraicamente resulta :
Cov ( X , Y ) = E ( X . Y ) - E ( X ) . E ( Y )
Se demuestra fácilmente (queda propuesto para el alumno) que si las variables X e Y son
independientes, E ( X . Y ) = E ( X ) . E ( Y ) , en consecuencia la covarianza se anula.
5.4.2 COEFICIENTE DE CORRELACION
Dadas dos variables aleatorias X e Y, el coeficiente ce correlación entre X e Y denotado por

ρ xy se define como :
Cov ( X, Y)
ρ xy =
D(X) D(Y)
Se demuestra : - 1 ≤ ρ xy ≤ + 1
El coeficiente de correlación es a menudo, de más fácil interpretación que la covarianza.
Al no expresarse en unidades es útil para comparar las relaciones lineales entre pares de
variables que tienen unidades distintas.
Si los puntos en la distribución de probabilidad conjunta de X e Y tienden a caer a lo largo de

una recta con pendiente positiva ( o negativa ) entonces ρ xy es próximo a + 1 ( ó -1 ) .
Si ρ xy es igual a +1 o a -1, entonces puede demostrarse que los puntos en la distribución de
probabilidad conjunta caen exactamente a lo largo de una recta.
Demostración :
Sea Y = AX + B
- E(Y) = AE(X) + B
- V ( Y ) = A2 V ( X )
- D(Y) = |A| D(X)
- Cov ( X , Y ) = E { [ X - E ( X ) ] [ Y - E ( Y )] } = E { A [ X - E ( X ) ] 2 } =
= A E [ X - E ( X ) ]2 = A V ( X )
Recordando que:
Cov(X, Y)
ρ xy =
D(X) D(Y)
y reemplazando resulta :
+1 si A > 0
A V(X)
ρ xy = =
A V(X)
-1 si A < 0
Si X e Y son independientes ⇒ ρ xy = 0
La recíproca no es válida, si ρ xy = 0 ⇒ ausencia de relación lineal entre las variables.
Gráficamente :
5.5 FUNCIONES DEL VECTOR ALEATORIO
Hay situaciones en las que puede interesar el estudio de una variable aleatoria Z, que sea
función de la variable aleatoria bidimensional ( X , Y ), por ejemplo :
Z = X+Y ; Z = X-Y ; Z = X.Y ; Z = mín ( X , Y ) ; etc.
Para el ejemplo del caso discreto, la variable Z = X + Y está representando el número total de
artículos producidos en ambas líneas o Z = mín (X,Y) será el menor número de artículos
producidos por ambas líneas.
Encontrar la distribución de probabilidad de la variable Z es bastante sencillo si el vector

aleatorio es discreto, siendo más complicado en el caso del vector aleatorio continuo.
5.5.1 SUMA DE VARIABLES ALEATORIAS
Dada la variable aleatoria Z = X + Y se desarrollarán los parámetros estadísticos que

caracterizan la distribución de probabilidad de dicha variable:
♦ ESPERANZA MATEMATICA
+∞ +∞
E (Z) = E ( X + Y ) = ∫ ∫ (x + y) f (x, y) dx dy =
−∞ −∞
+ ∞ + ∞  + ∞ + ∞ 
= ∫ x  ∫ f (x, y) dy  dx + ∫ y  ∫ f (x, y) dx  dy =
− ∞  − ∞  − ∞  − ∞ 
+ ∞ + ∞
= ∫ x f1 (x) dx + ∫ y f2 (y) dy = E(X) + E(Y)
− ∞ − ∞
Así como se demostró para el caso continuo se puede demostrar para el discreto.
n n
Generalizando: si Z = ∑ Xi resulta E (Z) = ∑ E (X i )
i= 1 i= 1
♦ VARIANZA
V ( X + Y ) = E [ X + Y - E ( X ) - E ( Y ) ]2 = E {[ X - E ( X ) ] + [ Y - E ( Y ) ] }2 =
E [ X - E ( X )]2 + E [ Y - E ( Y ) ]2 + 2 E { [ ( X - E ( X ) ] [ ( Y - E ( Y )] }
Recordando lo visto en el punto anterior, el último término del desarrollo de la V (X + Y) es la

covarianza entre X e Y, de donde:
V ( X + Y ) = V ( X ) + V ( Y ) + 2 Cov ( X , Y )
En el caso de variables independientes:
V(X+Y) = V(X) + V(Y)
Generalizando:
n n
si Z= ∑ Xi siendo las variables X i independie ntes : V (Z) = ∑ V (X i )
i= 1 i= 1
♦ DESVIO ESTANDAR
D ( X + Y ) = [ V ( X ) + V ( Y ) + 2 Cov ( X , Y ) ]½
D ( X + Y ) = [ V ( X ) + V ( Y ) ]½ si X e Y son independientes
Ejemplo :
En el ejemplo de los artículos producidos por dos líneas se definieron las variables:
X : número de artículos producidos por la línea A
Y : número de artículos producidos por la línea B
Z = X + Y: número de artículos producidos por ambas líneas.
La distribución de probabilidad de la variable Z es la que se muestra en la siguiente tabla:
zi Probabilidad
0 0,00
1 0,05
2 0,12
3 0,26
4 0,30
5 0,27
1,00
Las probabilidades que figuran en la última columna surgen de la distribución de

probabilidad conjunta del vector (X , Y), por ejemplo:
P(Z=2) = P(X=2,Y=0)+P(X=1,Y=1)+P(X=0,Y=2)
= 0,06 + 0,04 + 0,02 = 0,12
Además E ( Z ) = 1 . 0,05 + 2 . 0,12 + 3 . 0,26 + 4 . 0,30 + 5 . 0,27 = 3,62
V ( Z ) = E ( Z2 ) - [ E ( Z )] 2 = 14,42 - ( 3,62)2 = 1,3156
A través del ejemplo verificaremos las relaciones vistas con respecto a la esperanza y
varianza de la suma:
 E(X+Y) = E(X)+E(Y)
 V ( X + Y ) = V ( X ) + V ( Y ) + 2 Cov ( X , Y )
E ( X ) = 1 . 0,16 + 2 . 0,26 + 3 . 0,55 = 2,33

E ( Y ) = 1 . 0,33 + 2 . 0,48 = 1,29
de donde E ( X + Y ) = 2,33 + 1,29 = 3,62
E ( X2 ) = 12 . 0,16 + 22 . 0,26 + 32 . 0,55 = 6,15

V ( X ) = 6,15 - 2,332 = 0,7211
D ( X ) = 0,8492
E ( Y2 ) = 12 . 0,33 + 22 . 0,48 = 2,25

V ( Y ) = 2,25 - 1,292 = 0,5859
D ( Y ) = 0,7654
E ( X . Y ) = 1 . 1 . 0,04 + 1 . 2 . 0,09 + 1 . 3 . 0,19 + 2 . 1 . 0,08 + 2 . 2 . 0,11 + 2 . 3 . 0,27

= 3,01
Cov ( X , Y ) = 3,01 - 2,33 . 1,29 = 0,0043
de donde V ( X + Y ) = 0,7211 + 0,5859 + 2 . ( 0,0043 ) = 1,3156
Se puede también calcular el coeficiente de correlación
0,0043
ρ xy = = 0,007
0,8492 0,7654
5.5.2 DIFERENCIA DE VARIABLES ALEATORIAS
Sea una variable Z = X - Y
Se demuestra fácilmente que:
 E(X-Y) = E(X) - E(Y)
 V ( X - Y ) = V ( X ) + V ( Y ) - 2 Cov ( X , Y )
y en caso de ser las variables X e Y independientes :
 V(X-Y) = V(X)+V(Y)
 D(X-Y) = [ V ( X ) + V ( Y ) ]½
5.6 PROPIEDADES REPRODUCTIVAS
Hay algunas distribuciones de probabilidad que tienen la siguiente propiedad de mucha utilidad:
“si dos (o más) variables aleatorias independientes se suman, la variable aleatoria que
resulta tiene una distribución del mismo tipo que la de los sumandos”.
Esta propiedad recibe el nombre de propiedad reproductiva y se establece para algunas

distribuciones importantes que se enuncian a continuación:
 Sean X1, X2……… Xn n variables aleatorias independientes con

distribución N ( µi , σi2 ) , i = 1,2,…..n
Sea Z = X1 + X2 +……… + Xn.
 n n 
Se demuestra que : Z ∼ N  ∑ μi , ∑ σ i2 

 i= 1 i= 1 
 Sean X1, X2……… Xn , n variables aleatorias independientes con

distribución de Poisson de parámetro λi , i = 1,2,…..n.
Sea Z = X1 + X2 +……… + Xn.
Se demuestra que :
 n 
Z ∼ Po  ∑ λi 

 i= 1 
 Sean X1, X2……… Xk , k variables aleatorias independientes con

distribución binomial Xi ∼ Bi ( ni , p ) , i = 1,2,…..k.
Sea Z = X1 + X2 +……… + Xk.
Se demuestra que :
Z ∼ Bi (n, p ) con n = n1 + n2 + ……+ nk
 Sean X1, X2……… Xk , k variables aleatorias independientes con

distribución χ2ni , i = 1,2,…..k.
Sea Z = X1 + X2 +……… + Xk.
Se demuestra que :
Z ∼ χ2n con n = n1 + n2 + ……+ nk
Ejemplo :
Un aparato de televisión puede tener dos tipos de roturas: debido a falla de transistores o
debido a la falla de condensadores. Ambas fuentes de rotura son independientes.
El número de roturas debido a la falla de transistores durante los dos primeros años de
utilización del aparato es una variable aleatoria que sigue una ley de Poisson con promedio
1.
El número de roturas debido a la falla de condensadores durante el mismo período sigue
una ley de Poisson con promedio 2.
Calcule la probabilidad de que en el primer año de utilización del aparato, éste tenga
exactamente dos roturas.
Sean las variables:
Xt : número de roturas debido a fallas de transistores en un período de t años
Yt : número de roturas debido a fallas de condensadores en un período de t años
Xt ∼ Po ( λ1t ) ⇒ X2 ∼ Po ( 1 ) ⇒ X1 ∼ Po ( 0,5 )
Yt ∼ Po ( λ2t ) ⇒ Y2 ∼ Po ( 2 ) ⇒ Y1 ∼ Po ( 1 )
Sea Zt : Número de roturas en un período de t años
Zt = Xt + Yt
Por la propiedad reproductiva de la distribución de Poisson :
Zt ∼ Po ( λt ) ⇒ Z1 ∼ Po ( 0,5 + 1 = 1,5 )
Entonces : P ( Z1 = 2 ) = 0,2510
5.7 TEOREMA CENTRAL DEL LIMITE

Sean X1 , X2 , ….. Xn , …… una sucesión de variables aleatorias independientes con :
E ( Xi ) = µ i y V ( Xi ) = σ2i i = 1, 2,……, n
Sea Y = X1 + X2 + ……... + Xn
n
Y− ∑ μy
i= 1
Sea Z = 1
 n  2

 ∑ σ i2 

 i= 1 
Se demuestra que, bajo ciertas condiciones generales, en el límite cuando n tiende a infinito:
Z ∼ N(0,1)
 n n 
con lo cual Y ∼ N  ∑ μi , ∑ σ i2 

 i= 1 i= 1 
En la práctica el número de variables aleatorias independientes necesarias depende de la

forma de la distribución de las variables que integran la suma. Cuando no se conoce la forma
de las mismas o éstas son asimétricas, el criterio general es sumar al menos 30 variables
aleatorias independientes. Sin embargo, si la distribución es uniforme, sumando al menos 6
variables aleatorias independientes alcanza para que la suma sea aproximadamente normal.
La aplicación de este importante teorema se verá en el desarrollo de la Unidad 3: Inferencia
Estadística.
Ejemplo :
Una construcción consta de 80 etapas. El tiempo de ejecución de cada etapa (en días) es
una variable aleatoria distribuida uniformemente en el intervalo (1 , 5).
Calcule la probabilidad de que la construcción tarde en su ejecución más de 260 días. Se
supone que los tiempos de ejecución de cada etapa son variables aleatorias
independientes.
Ti : tiempo de ejecución ( en días ) de la etapa i
5+ 1
Ti ∼ U ( 1 , 5 ) , donde E (Ti ) = = 3 días
2
( 5 - 1 )2 4
V (Ti ) = = días2
12 3
D (Ti ) = 1,15 días
80
T : tiempo de ejecución de la construcción ∑ Ti
i= 1
80 80
E ( T ) = E ( ∑ Ti ) = ∑ E(Ti ) = 80 . 3 = 240 días
i= 1 i= 1
80 80
V ( T ) = V ( ∑ Ti ) = ∑ V(Ti ) = 80 . 4/3 = 106,6 días 2
i= 1 i= 1
D ( T ) = 10,33 días
por el teorema central del límite : T ∼ N ( 240 ; 10,33 )
T − 240
y en consecuencia : Z = ∼ N(0,1)
10,33
P ( T > 260 ) = 1 - P ( T < 260 ) = 1 - P ( Z < 1,94 ) = 1 - 0,9738 = 0,0262
Observación: La aproximación normal a la distribución binomial y de Poisson vistas en el

capítulo 4, son casos especiales de la aplicación del Teorema Central del Límite.
1.- El número de camiones que llegan a un establecimiento durante la mañana de un día es

una variable aleatoria X con la siguiente distribución de probabilidad:
x 0 1 2 3
Probabilidad 0,2 0,1 0,3 0,4
El número de camiones que llega en un día durante la tarde es una variable aleatoria Y con
la siguiente distribución de probabilidad :
y 0 1 2
Probabilidad 0,5 0,2 0,3
Calcule la probabilidad de que un día determinado lleguen a lo sumo tres camiones. Se

supone que las variables X e Y son independientes.
2.- El siguiente cuadro muestra la distribución conjunta de ( X , Y )
X -1 0 1
Y
0 0 1/3 0 a ) Calcule
1 1/3 0 1/3 el
coeficiente
de correlación.
b ) ¿ Son X e Y independientes ? Justifique su respuesta.
3.- La entrada de un sistema de comunicación binario es una variable aleatoria X que toma los
valores 0 ó 1 con probabilidades 3 / 4 y 1 / 4 respectivamente. En algunas ocasiones, debido
a errores causados por ruidos en el sistema, la salida Y difiere de la entrada X.
El comportamiento del sistema está dado por las siguientes probabilidades :
P(Y=1/X=1) = 3/4
P(Y=0/X=0) = 7/8
a ) Halle la distribución de probabilidad conjunta del vector ( X , Y ) :
X
Y 0 1
0
1
b) Halle la distribución de probabilidad de Y.

c) Calcule ρ xy . ¿Son X e Y independientes? Justifique.
4.- La longitud de un artículo se distribuye normalmente con esperanza matemática 13 cm y

desvío estándar 0,15 cm. Este artículo se envasa en cajas de plástico cuya longitud interior
está distribuida normalmente con desvío estándar 0,12 cm.
¿Cuánto debe valer la esperanza matemática de la longitud interior de las cajas para que la
probabilidad de que la longitud de un artículo supere la de la caja sea del 1%?
5.- Al sumar números una computadora aproxima cada uno de ellos al entero más próximo. Se
supone que todos los errores de aproximación ( Xi ) son independientes y se distribuyen
uniformemente en el intervalo ( - 0,5 ; 0,5 ).
a) Si se suman 500 números, ¿cuál es la probabilidad de que la magnitud del error total
exceda 15?
b) ¿Cuántos números deben sumarse para que la magnitud del error total sea menor que
10 con probabilidad 0,9?
6.- Una empresa dedicada a la venta de repuestos para un sistema electrónico conoce que la
demanda diaria del mismo es 0, 1 o 2 repuestos con probabilidad 0,25 ; 0,5 y 0,25
respectivamente. Se conoce que desde el momento en que se hace el pedido hasta que el
mismo ingresa al stock transcurren 90 días.
Determine cuántas unidades deben tenerse en existencia en el momento de hacer el pedido
si se quiere que la probabilidad de que la demanda durante los 90 días supere la existencia
sea igual a 0,05
7.- Un conmutador recibe llamadas dirigidas hacia dos oficinas A y B. El número de llamadas
que llegan al conmutador sigue un proceso de Poisson con promedio 2 llamadas por minuto.
a) Si el promedio de llamadas dirigidas a la oficina A por hora es de 90 llamadas, ¿cuál es
el promedio de llamadas dirigidas a la oficina B por hora?
b) Se consideran 200 períodos de 4 minutos cada uno. Halle la probabilidad de que a lo
sumo en 20 de ellos el número de llamadas dirigidas a la oficina A sea superior a 9
(Llegar al resultado numérico).
8.- El diámetro (en mm) de una pieza es una variable aleatoria (X) con función de densidad:
1/7 (4x + 1) 1≤x≤2

f (x ) =
0 en otro caso
Una pieza es considerada buena si 1,05 ≤ X ≤ 1,95.

El costo de fabricación es de $ 15.
El precio de venta depende del diámetro. Si éste cumple con la especificación, el precio de
venta será de $ 40, si el diámetro supera 1,95 queda reducido a $30 y si no alcanza 1,05 se
descarta la pieza.
a) Halle la distribución de probabilidad de la variable aleatoria: ganancia neta por pieza.
b) Halle su esperanza matemática y varianza.
c) ¿Cuál es la probabilidad de que se obtenga una ganancia superior a $2.300 de la venta
de un lote de 100 piezas?
6. DISTRIBUCIONES
MUESTRALES
CONTENIDO
6 DISTRIBUCIONES MUESTRALES ........................................ 127

6.1 INTRODUCCION................................................................................... 127
6.2 PARÁMETROS Y ESTADÍSTICOS ...................................................... 128
6.3 DISTRIBUCIÓN DEL PROMEDIO MUESTRAL ................................... 129
6.4 DISTRIBUCIÓN DE LA FRECUENCIA RELATIVA ............................. 135
6.5 DISTRIBUCION DE LA VARIANZA MUESTRAL................................. 136
6.6 EJERCICIOS PROPUESTOS ............................................................... 137
APÉNDICE..................................................................................................... 139
DISTRIBUCIONES MUESTRALES 127
6 DISTRIBUCIONES MUESTRALES
6.1 INTRODUCCIÓN
En el capítulo 1 hemos definido la inferencia estadística como un proceso que usa

información proveniente de la muestra para generalizar y tomar decisiones acerca de toda la
población en estudio. Sin embargo, hasta el momento hemos trabajado la muestra y la
población por separado.
En el capítulo 2, trabajamos herramientas útiles en el análisis exploratorio de los datos
provenientes de una muestra, tanto gráficos como resúmenes numéricos para extraer
información de interés para la inferencia. Hablamos de distribuciones de frecuencias y
estadísticos.
En los capítulos 3, 4 y 5, a través del lenguaje de la probabilidad, tratamos los modelos para
las poblaciones que pueden ser de interés, sobre las cuales nos interesa sacar conclusiones, o
tomar una decisión. Definimos las variables aleatorias, sus distribuciones de probabilidad,
parámetros y algunos modelos frecuentes.
Podemos hacer un cuadro comparativo entre características del análisis exploratorio de datos y
de la inferencia estadística:
Análisis exploratorio de datos Inferencia estadística
Su objetivo es la exploración de los datos Su objetivo es responder preguntas

muestrales, en busca de regularidades concretas sobre la población, planteadas
interesantes. antes de la obtención de los datos.
Las conclusiones sólo se aplican a las Las conclusiones se extienden a toda la

unidades de análisis y a las circunstancias población en estudio.
para las cuales se obtuvieron los datos.
Las conclusiones se basan en lo que Las conclusiones se explicitan con un grado

“vemos” en los datos. de confianza.
Muchas de las técnicas utilizadas en inferencia exigen, también, que la distribución de los datos
tenga determinadas características. El análisis de datos es de gran ayuda en este aspecto,
para descubrir observaciones atípicas y otras desviaciones que puedan perturbar una correcta
inferencia. Por lo tanto, en la práctica podemos observar cómo el análisis exploratorio de los
datos y la inferencia estadística se complementan.
Como se mencionó en el capítulo I, muy frecuentemente es necesario seleccionar una muestra

de unidades de la población, para extraer conclusiones respecto de la misma, en base a las
observaciones muestrales (ver Muestra, pag. 7).
Sintetizando:
Cuando el interés reside en generalizar las conclusiones de los resultados observados a la
población en estudio o queremos tomar una decisión sobre la población en base a una
muestra, estamos frente a un problema de inferencia estadística.
Para que este proceso sea adecuado, debemos tener en cuenta:
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
Plantear claramente el problema.

Delimitar la población en estudio1
Definir si el objetivo reside en estimar el valor de un parámetro desconocido de la
población (por ej. µ, σ, p) a partir de un estadístico calculado con los datos de una
muestra o decidir sobre valores hipotéticos que asignamos a dichos parámetros.
Hacer un correcto diseño para la obtención de los datos muestrales 2. Los resultados de
las técnicas para la inferencia que se utilizarán sólo serán válidos si la muestra es
obtenida por métodos aleatorios, que son los métodos que dan “confianza” de
seleccionar muestras representativas de la población. Un buen diseño para la
obtención de los datos, es la mejor garantía de que la inferencia tenga valor.
Tener en cuenta y verificar los requerimientos de las técnicas a aplicar
6.2 PARÁMETROS Y ESTADÍSTICOS
Un parámetro es un número que describe algún aspecto de la población en estudio. En la

práctica, en la mayoría de los casos (población infinita, pruebas destructivas, etc) el valor del
parámetro es desconocido.
Un estadístico es un número que se calcula a partir de los datos muestrales. Si se lo utiliza
para estimar un parámetro desconocido, se lo conoce con el nombre de estimador.
El objetivo de este capítulo y los próximos es desarrollar el por qué y cómo se utilizan los
estadísticos para estimar a los correspondientes parámetros.
Tengamos en cuenta que el valor del parámetro es fijo, mientras que el valor de un estadístico
está en función de la muestra seleccionada y por lo tanto podrá variar de una muestra a otra.
Si de alguna manera, pudiéramos medir la precisión de este proceso, es decir, si pudiéramos
evaluar si el valor del estadístico va a estar cerca del valor del parámetro correspondiente, para
cualquier muestra extraída de la población, entonces estaríamos en condiciones de hacer
“buenas inferencias”. Es aquí donde la técnica de muestreo y el tamaño de la muestra juegan
un papel fundamental.
Como se mencionó en el capítulo I, pag. 8 trabajaremos con muestras aleatoria simples, en
donde cada elemento de una muestra de tamaño n es una variable aleatoria, siendo X1, X2,…
Xn, variables independientes entre sí3.
Sólo cuando se utiliza el azar para escoger los elementos que conforman una muestra,
podemos describir cómo varía el estadístico. Al obtener de forma repetida de una población
distintas muestras del mismo tamaño, podemos encontrar la distribución muestral del
estadístico, como veremos seguidamente.
1
Así, por ej., si se quiere analizar cierta característica de los alumnos que cursaron en la Fac. Reg. Rosario de la
UTN en los años 2005 y 2006 y la muestra se elige seleccionando alumnos al azar solamente de los que cursaron
durante esos años en ISI, las conclusiones que se extraigan a partir de esta muestra serán válidas sólo para la
población de los alumnos de ISI, pero no para todos los alumnos de la Fac. Reg. Rosario.
2
Ya hemos dicho que en el curso sólo se trabajará con muestras aleatorias simples.
3
En el caso de poblaciones finitas, el muestreo debe ser con reposición para que la ocurrencia de una observación
no aumente o disminuya la probabilidad de ocurrencia de otra (ver ej. 1 y 2, pag. 58, Cap. III)
Denominamos variabilidad muestral al hecho de que el valor de un estadístico varía en un

muestreo aleatorio repetido. Para comprenderlo podemos recurrir a la teoría de la probabilidad
o la simulación a partir de un ejemplo sencillo, como el que se plantea a continuación.
6.3 DISTRIBUCION DEL PROMEDIO MUESTRAL

Consideramos:
V Variable aleatoria → X: edad de hermanos de una familia, en años
Tamaño de la población → N=4
Espacio muestral → Sx = {2, 4, 6, 8}
Distribución de probabilidad → Uniforme discreta
Distribución de Probabilidad de X
Tabla 1
x P(X=x) 0,30
2 0,25 0,25
Probabilidad
0,20
4 0,25
0,15
6 0,25
0,10
8 0,25
0,05
1 0,00
2 4 6 8
Parámetros: Esperanza Matemática µx = 5 x: edad en años
Varianza σ2x = 5
V Tomamos muestras de tamaño 2, con reposición. Cada muestra es de la forma (x1 ; x2),
donde:
Tabla 2
Xi es el i-ésimo elemento de la muestra. Muestra, n=2
x1 x2 Promedio
Simbolizaremos con x al promedio muestral y con S al desvío estándar 2 2 2
de la muestra.
2 4 3
2 6 4
En la tabla 2 están todas las posibles muestras con sus
2 8 5
correspondientes promedios.
4 2 3
4 4 4
Observamos que tanto el primer elemento de la muestra como el 4 6 5
segundo son variables aleatorias, ya que, antes de realizar el muestreo, 4 8 6
no sabemos qué valores tomarán. Si consideramos la distribución de 6 2 4
probabilidad de cada una de ellas, resultan idénticas a la distribución de
6 4 5
probabilidad de la población de la cual fueron extraídas las muestras,
6 6 6
siendo por lo tanto, iguales los parámetros estadísticos:
6 8 7
µxi = 5 y σ2xi = 5 8 2 5
8 4 6
En la tabla 2, también se visualiza que el promedio muestral es una 8 6 7
variable aleatoria. 8 8 8
Consideramos ahora esta nueva variable aleatoria
X : edad promedio de 2 hermanos elegidos al azar de entre los 4, con reposición.
Como podemos observar en la Tabla 2, para la variable X :

Espacio muestral S x = {2, 3, 4, 5, 6, 7, 8}
La distribución de probabilidad es:
Distribución del promedio muestral, n=2
Tabla 3: n=2
x Probabilidad 0,30
2 0,0625 0,25
Probabilidad
3 0,1250 0,20
4 0,1875 0,15
5 0,2500 0,10
0,05
6 0,1875
0,00
7 0,1250
2 3 4 5 6 7 8
8 0,0625
1,0000 Prom edio de la m uestra de tam año 2
Parámetros: Esperanza Matemática µx = 5

Varianza σ x2 = 2.5
Observemos que la distribución del promedio adopta una forma completamente distinta de
la distribución uniforme de los datos de origen.
V Repitiendo la experiencia, con muestras de tamaños 3, 4 y 5 respectivamente, obtenemos

las distribuciones de los promedios que mostramos a continuación, acompañadas de las
gráficas respectivas:
n=3 n=4 n=5

Promedio Probabilidad Promedio Probabilidad Promedio Probabilidad
2,00 0,015625 2 0,00390625 2 0,00097656
2,67 0,046875 2,5 0,01562500 2,4 0,00488281
3,33 0,093750 3 0,03906250 2,8 0,01464844
4,00 0,156250 3,5 0,07812500 3,2 0,03417969
4,67 0,187500 4 0,12109375 3,6 0,06347656
5,33 0,187500 4,5 0,15625000 4 0,09863281
6,00 0,156250 5 0,17187500 4,4 0,13183594
6,67 0,093750 5,5 0,15625000 4,8 0,15136719
7,33 0,046875 6 0,12109375 5,2 0,15136719
8,00 0,015625 6,5 0,07812500 5,6 0,13183594
1 7 0,03906250 6 0,09863281
7,5 0,01562500 6,4 0,06347656
8 0,00390625 6,8 0,03417969
1 7,2 0,01464844
7,6 0,00488281
8 0,00097656
1
0,30
0,25
Probabilidad
0,20
0,15
0,10
0,05
0,00
2 3 4 5 6 7 8
Prom edio de la m uestra de tam año 2
0,20 Distribución del promedio muestral, n=3
0,15
Probabilidad
0,10
0,05
0,00
2,00 2,67 3,33 4,00 4,67 5,33 6,00 6,67 7,33 8,00
Prom edio de la m ue stra de tam año 3

0,20
0,15
Probabilidad
0,10
0,05
0,00
2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 8
Prom e dio de la m ue stra de tam año 4
0,20
0,15
Probabilidad
0,10
0,05
0,00
2 2,4 2,8 3,2 3,6 4 4,4 4,8 5,2 5,6 6 6,4 6,8 7,2 7,6 8
Promedio de la m uestra de tam año 5
En las gráficas anteriores podemos comprobar una aplicación del Teorema Central del Límite:
a medida que aumenta el tamaño de la muestra la distribución de probabilidad del promedio
muestral se hace cada vez más acampanada, concentrándose alrededor del promedio de la
población original.
Tabla 4
La Tabla 4 permite comparar los parámetros esperanza
matemática y varianza de la población original, con la Población µ x =5 σ x2 = 5
esperanza matemática y varianza de las poblaciones de Tamaño de
los promedios muestrales antes descriptas. muestra µx σ x2
2 5 2,5
Vemos que las medias poblacionales se mantienen
3 5 1,667
iguales a 5 (la esperanza matemática de las edades de
los 4 hermanos), mientras que las varianzas 4 5 1,25
poblacionales disminuyen su valor a medida que 5 5 1
aumenta el tamaño de la muestra.
Al considerar la distribución de los valores tomados por el estadístico X en todas las muestras
de un mismo tamaño n de la misma población, obtenemos la distribución muestral de X .
Generalizando:
Distribución muestral de la media muestral X
Si las muestras aleatorias simples de tamaño n son tomadas de una población con
media poblacional µ y desvío estándar poblacional σ , la distribución muestral de
X tiene las siguientes propiedades:
Ö
Ö 1) µ x = E( X ) = µ
Es decir, el promedio de todos los posibles valores de X es igual al parámetro µ
σ
Ö
Ö 2) σx =
n
Cuando el tamaño de la muestra aumenta, la medida de dispersión disminuye. Es
decir, a medida que el número de observaciones obtenidas aumenta, el promedio
de los valores observados se acerca más y más a µ (Ley de los grandes
números)
ÖÖ 3) Si la población de la cual se extraen las muestras es normal,
la distribución de X es también normal con media y desvío como los dados en los
puntos anteriores, para cualquier tamaño muestral n.
Ö
Ö 4) Si la población de la cual se extraen las muestras no es normal,
pero el tamaño muestral es “suficientemente” grande, la distribución de X es
aproximadamente normal con media y desvío como los dados en los puntos
anteriores. Suficientemente grande en la práctica significa un tamaño de muestra n
≥ 30 (Teorema Central del Límite).
El tamaño n de la muestra, necesario para que X se aproxime a una distribución
normal depende de la distribución de la población. En el caso de que las muestras
se extraigan de una población uniforme son suficiente 6 observaciones para que la
distribución del promedio muestral sea aproximadamente normal.
Ö
Ö 5) Si la población de la cual se extraen las muestras es normal,
con media poblacional µ y desvío estándar poblacional σ , pero ésta es
desconocida, se reemplaza σ por S (desvío estándar muestral) y la estadística
(x − µ)
deja de tener distribución normal estandarizada y tiene una distribución t
S/ n
(a)
Student con n-1 grados de libertad :
(X − µ )
∼ t n −1; α
S/ n
(Ver demostraciones en el Apéndice)
(a)
La apariencia general de la distribución t es similar a la de la distribución normal estándar: ambas son simétricas
y unimodales y el valor máximo de la ordenada se alcanza en la media µ = 0. Sin embargo esta distribución tiene
colas más amplias que la normal. Existe una distribución t distinta para cada tamaño de muestra. Una distribución t
viene determinada por un parámetro llamado grados de libertad. A medida que aumentan los grados de libertad, la
curva de densidad t se parece más a la curva de la N(0,1), ya que la estimación de σ por s se va haciendo más
precisa.
La propiedad 1 indica que el estimador X es insesgado, ya que el centro de su

distribución muestral es igual al valor del parámetro poblacional correspondiente.
La propiedad 2 hace a la variabilidad o precisión del estimador y vemos que a medida

que el tamaño muestral crece la precisión del estimador es mayor, ya que la variación
alrededor del parámetro desconocido disminuye (propiedad de convergencia). Si la
distribución de un estadístico muestra valores muy alejados, se dice que carece de
precisión.
Idealmente buscamos un estimador que cumpla estas dos propiedades: que sea insesgado y
convergente4:
Un estadístico es insesgado si el centro de su distribución muestral es igual al

valor del parámetro poblacional correspondiente.
Un estadístico es convergente si su desviación estándar disminuye a medida

que el tamaño de muestra crece.
El estadístico X , por poseer estas propiedades, es un buen estimador de µ .

Estas propiedades también se cumplen para la proporción muestral o frecuencia relativa ( fr ) y
la varianza muestral ( S n2 −1 ), siendo por lo tanto respectivamente, buenos estimadores de la
proporción poblacional (p) y varianza poblacional ( σ 2 ), como veremos en los puntos 6.4 y 6.5.-
En general, la notación que utilizaremos para los estimadores es la siguiente:
Parámetro Estimador
µ µ̂ = X
p p̂ = fr
σ2 σ̂ 2 = Sn2 -1
4
Estas condiciones permiten controlar los errores de estimación al aumentar el tamaño de la muestra, como
veremos más adelante.
6.4 DISTRIBUCION DE LA FRECUENCIA RELATIVA o PROPORCIÓN

MUESTRAL
El estadístico pˆ = f r es un buen estimador del parámetro p (proporción poblacional o

probabilidad).
Si simuláramos tomar muchas muestras de igual tamaño y en cada una de ellas calculáramos
la proporción de veces que ocurre un suceso A, hallaríamos:
⇒ La distribución de la proporción muestral es aproximadamente normal 5

⇒ Su media se encuentra cerca de la proporción poblacional p
⇒ Su desviación estándar se hace menor a medida que el tamaño de la muestra se hace
mayor.
Generalizando:
Distribución muestral de la pˆ = f r (proporción muestral)
Si de una población donde p representa la proporción de elementos que tienen

cierta característica A, se toman muestras aleatorias simples de tamaño n, la
distribución muestral de la proporción muestral o frecuencia relativa ( pˆ = f r ) de las
veces que ocurre A en n, tiene las siguientes propiedades:
Ö
Ö 1) E (fr) = p
Es decir, el promedio de todos los posibles valores de fr es igual al parámetro p.
) p(1 − p )
Ö
Ö 2) σ p) = Var(p ) =
n
decir, a medida que el número de observaciones obtenidas aumenta, el promedio
de los valores observados se acerca más y más a p (Ley de los grandes números).
Observe que para un tamaño de muestra fijo, la máxima desviación estándar se
encuentra en p = 0,5
Ö
Ö 3) Si n es “suficientemente” grande (b), la distribución de pˆ = f r
se comporta aproximadamente como una distribución normal con media y
desviación estándar como las dadas en los puntos 1 y 2.
) ⎛ p(1 - p) ⎞⎟
p es aproximada mente N ⎜⎜ p;
⎝ n ⎟⎠
5
⇒ Para poder aproximar la distribución Binomial a la Normal, el tamaño de muestra n debe ser “suficientemente”
grande. Como regla empírica esta aproximación es apropiada si np > 5 (Cap. 4).
6.5 DISTRIBUCION DE LA VARIANZA MUESTRAL
El estadístico S n2 −1 es un buen estimador del parámetro σ 2 (varianza poblacional).6

Si simuláramos tomar muchas muestras de igual tamaño y en cada una de ellas calculáramos
la varianza muestral, hallaríamos:
⇒ La media de la varianza muestral se encuentra cerca de la varianza poblacional σ
2
⇒ Su desviación estándar se hace menor a medida que el tamaño de la muestra se hace

mayor.
Generalizando:
Distribución muestral de la S 2 (varianza muestral)
Si de una población se toman muestras aleatorias simples de tamaño n, la

distribución muestral de la varianza muestral S n2 −1 , tiene las siguientes propiedades:
Ö
Ö 1) E ( S2 ) = σ 2
Es decir, el promedio de todos los posibles valores de S n2 −1 es igual al parámetro σ 2
2σ4
Ö
Ö 2) V(S 2 ) = σ S2 2 =
n -1
decir, a medida que el número de observaciones obtenidas aumenta, el promedio de
los valores observados de S2 se acerca más y más a σ 2 (Ley de los grandes
números).
Ö
Ö 3) Si la población de la cual se extraen las muestras es normal,
2
(n − 1) S
la variable tiene una distribución ji cuadrado ( χ 2 ) con n - 1 grados de
σ2
libertad (b):
(n− 1) S 2
∼ χ n2 -1
σ2
Ö
Ö 4) Si n es “suficientemente” grande, la distribución de la variable
2
χ se ve como una distribución normal con media y desviación estándar como las
dadas en los puntos 1 y 2.
(b)
Las distribuciones ji cuadrado son una familia de distribuciones que sólo toman valores positivos y que son
asimétricas hacia la derecha. Una distribución ji cuadrado viene determinada por un parámetro llamado grados de
libertad. A medida que aumentan los grados de libertad, las curvas de densidad son menos asimétricas y por lo
tanto, los valores mayores son más probables.
6 2
Utilizaremos la notación S para identificar a la variable Sn2-1 (varianza muestral).
En este material hemos tratado el comportamiento de las distribuciones muestrales de algunos

estimadores cuando se toman muestras aleatorias simples.
Se analizó que si el tamaño de muestra es más grande, la distribución de estos estimadores

tiende a centrarse más y más alrededor del valor del parámetro que se quiere estimar.
En la práctica no se conocerá el verdadero parámetro poblacional (por eso la estimación) y se

tomará una sola muestra (no muchas como cuando se simuló la distribución del promedio
muestral), pero son las propiedades (insesgado y convergencia) las que garantizan que cuando
la muestra que se toma sea grande habrá una alta probabilidad de que el valor que toma el
estimador (estimación) esté cerca del verdadero valor del parámetro que se quiere estimar.
6.6 EJERCICIOS PROPUESTOS 7
1.- El 9 % de los individuos de una región tiene sangre tipo B. En una muestra simple al azar de
400 personas de esa población se encontró que 12,5 % tenían sangre tipo B.
a) Indique:
- valor numérico del parámetro: …….
- valor numérico del estadístico: …….
- identifique en términos del problema al parámetro y al estadístico
b) ¿Cuál es la probabilidad de que una nueva muestra aleatoria de tamaño 400 contenga
por lo menos un porcentaje de 12,5 % de personas con sangre tipo B?
2.- Considere la variable aleatoria X: peso de alumnos varones de UTN, FRRO.
Se conoce que esta variable tiene una distribución normal con promedio 75 kg y una
desviación estándar de 7 kg.
a) Grafique y compare las distribuciones muestrales de X cuando se extraen muestras
aleatorias simples de:
* 10 alumnos * 30 alumnos * 100 alumnos
b) ¿Cuál es la proporción de muestras de tamaño 30 que arrojarán un valor del promedio
alejado del promedio poblacional en a lo sumo 2 desviaciones estándares?
3.- Suponga que el 60% de todos los estudiantes de la UTN, Reg. Rosario acceden a
información sobre cursos por medio de Internet.
a) Grafique en forma aproximada la distribución para la posible proporción muestral basada
en una muestra aleatoria simple de 100 estudiantes.
b) ¿Cuál es la probabilidad de observar una proporción muestral de 0,50 basada en una
muestra aleatoria simple de tamaño 100 si la proporción poblacional fuese de 0,60?
Explique.
4.- Sea X el número de accidentes por semana en una esquina dada. Suponga que la media de
X es 2,2 y el desvío estándar de X es 1,4.
a) Sea X el número promedio de accidentes por semana en un año, o sea, n= 52 semanas.
¿cuál es la distribución aproximada de la media muestral? Bosquéjela.
7
Los ejercicios 1, 3 y 4 fueron extraídos y adaptados del módulo Número 7: Distribuciones muestrales de la
Colección Métodos Estadísticos I., redactado por docentes de la UNR y extractado del libro “Interactive Statistics”
de Martha Aliaga, Universidad de Michigan, 2002.
b) ¿cuál es la probabilidad de que el promedio de accidentes por semana en un año sea

menor que 2?
c) ¿Cuán probable es que el número total de accidentes por año sea menor que 100?.
100
Sugerencia: P (Total < 100) = P (Promedio < ).
52
5.- Un contratista de obras viales ha tomado un contrato para construir una carretera de
hormigón de 800 km. de longitud. La carretera a construir será inspeccionada por vialidad
tomando muestras de tamaño 9 por cada 5 km. construidos. El tramo de 5 km. se aceptará
sin objeciones si la media de los espesores de las 9 determinaciones supera 149 mm. En
este caso la ganancia para el contratista es de 5000$ en los 5 km.
Si el promedio de las 9 determinaciones de los espesores se encuentra entre 140 mm y 149
mm también se aprueba el tramo pero con una quita en el precio, obteniéndose entonces
una utilidad de 2300$.
En cualquier otro caso se debe rehacer el tramo, lo que significa una pérdida de 3000$.
La variable aleatoria espesor tienen distribución normal con esperanza matemática igual a
145 mm y desvío estándar igual a 15 mm.
Considere la variable aleatoria “utilidad por tramo de 5 km.” Encuentre su distribución de
probabilidad, esperanza matemática y varianza.
¿Cuál es la probabilidad de que la construcción de los 800 km. dé una utilidad inferior a
300.000$ si los espesores son independientes de tramo a tramo?
6.- Demuestre que X es un estimador consistente de µ mediante el empleo de la desigualdad

de Chebyshev (vea ley de los grandes números en apéndice)
APÉNDICE
1.- Promedio Muestral o Media Aritmética

1 n
X= ∑ Xi
n 1
Siendo E(X) = µ y V(X) = σ2
y teniendo una Muestra Aleatoria Simple de tamaño n ⇒ (X1, X2,…..Xn),
2
entonces E( Xi ) = µ y V(Xi) = σ (estas condiciones fueron visualizadas en pag. 129 para
muestras de tamaño 2).
1 n 1 n
1 n
1
Luego E ( X )= E [ ∑
n 1
Xi ] = E 〈 ∑ Xi 〉 =
n 1 n
∑ E ( Xi) =
1 n
nµ = µ
1 n 1 n
1 n 1 1
V ( X )=V [ ∑
n 1
Xi ] = 2 V 〈 ∑ Xi 〉 = 2 〈 ∑VXi 〉 = 2 nV 〈 Xi 〉 = σ 2
n 1 n 1 n n
Con respecto a la distribución la variable promedio muestral podemos decir:
a) Si la variable aleatoria X se distribuye normalmente, por propiedad reproductiva :

σ
X ∼ N 〈µ, 〉
n
b) Si la variable X tiene cualquier distribución pero n ≥ 30 aplicando el Teorema Central del

Límite, la distribución aproximada es :
σ
X ∼ N 〈µ, 〉
n
2.- Proporción Muestral o Frecuencia Relativa
Sea una experiencia aleatoria y un suceso A asociado a la misma. Se realizan n

repeticiones independientes de la experiencia. Se definen las variables:
nA : número de veces que ocurre A en las n repeticiones independientes de la experiencia
fA :proporción de veces que ocurre A en las n repeticiones independientes de la experiencia

nA
siendo fA =
n
La variable aleatoria nA tiene distribución binomial con E (nA) = n.p y σ2 (nA) = n.p.(1-p)
p(1 − p )
y en consecuencia E ( fA ) = p y σ 2 ( fA ) =
n
3.- Varianza muestral (S2)
En la página 135 se plantea, para el caso en que la variable X se distribuya normalmente, que:
E ( S2 ) = σ 2
2σ4
V ( S2 ) = σ S2 2 =
n -1
A continuación se demuestran ambas igualdades.
( X − µ) ( X − µ) 2
Si X ∼ N ( µ , σ ) ⇒ ∼ N (0, 1) ⇒ 2
∼ χ21
σ σ
y en consecuencia :
n
( Xi − µ) 2
∑
ι =1 σ2
∼ χ2n por propiedad reproductiva de la distribución ji cuadrado
Se demuestra que:
n
( Xi − X )2 (n − 1) S 2
∑
ι =1 σ2
∼ χ2n-1 o en forma equivalente:
σ2
∼ χ2n-1
Además, para una variable χ2n sus parámetros son ⇒ E (χ2n) = n y V (χ2n) = 2 n
y en consecuencia para χ2n-1 ⇒ E (χ2n-1 ) = n – 1 y V (χ2n-1) = 2(n–1) (1)
Reemplazando en (1)
⎡ (n − 1) S 2 ⎤
E⎢ ⎥ = ( n − 1) ⇒ E ( S2 ) = σ2
⎣⎢ σ2 ⎦⎥
⎡ (n − 1) S 2 ⎤ (n − 1) 2 V(S 2 ) 2 σ4
V⎢ ⎥ = = 2 ( n − 1) ⇒ V ( S2 ) =
⎢⎣ σ2 ⎦⎥ σ4 (n − 1)
4.- LEY DE LOS GRANDES NUMEROS
En el capítulo 3 se dijo que después de un gran número de repeticiones de una experiencia, la

proporción de veces que ocurre un suceso en las n repeticiones (frecuencia relativa), se acerca
a la probabilidad de ese suceso. Esto se conoce como “ley de los grandes números” y se
puede demostrar matemáticamente a partir de las leyes de probabilidad 8.
Consideremos una experiencia aleatoria y un suceso A asociado a la misma. Se realizan
n repeticiones independientes de la experiencia y se definen las variables:
nA : número de veces que ocurre A en las n repeticiones de la experiencia
fA : proporción de veces que ocurre A en las n repeticiones de la experiencia
nA
siendo f A =
n
Se conoce que P(A) = p se mantiene constante en las n repeticiones de la experiencia.

Se demuestra que para un número positivo ε:
⎡ p (1 - p) ⎤
P ( | fA – p | < ε ) > 1 - ⎢ 2 ⎥ y lím P ( | f A − p < ε ) = 1
⎣⎢ n ε ⎥⎦ n→ ∞
es decir, que cuando n tiende a infinito la frecuencia relativa tiende a la probabilidad ( definición
frecuencial de probabilidad ).
Demostración :
nA ∼ Bi ( n , p ) E ( nA ) = n p σ2 ( nA ) = n p ( 1 – p )
p (1 − p)
y en consecuencia E ( fA ) = p σ2 ( fA ) =
n
Aplicando la desigualdad de Tchebychev :
⎡ p (1 − p) ⎤ 1
P ⎢ fA − p 〈 k ⎥ > 1− 2 (1)
⎣⎢ n ⎦⎥ k
p (1 − p) n ε2
Sea ε = k entonces k 2 =
n p (1 − p)
Reemplazando en (1), se obtiene lo que se quería demostrar:
⎡ p (1 - p) ⎤
P ( | fA – p | < ε ) > 1 - ⎢ 2
⎥
⎢⎣ n ε ⎥⎦
8
La ley de los grandes números se puede demostrar también a partir del comportamiento del promedio muestral. A
medida que el número de observaciones obtenidas aumenta, la media de los valores observados se acerca más y
más a µ.
7. INTERVALOS DE
CONFIANZA
CONTENIDO
7.1 INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA ........................................ .143
7.2 INTERVALOS DE CONFIANZA ......................................................................... .143
7.3 INTERVALOS DE CONFIANZA PARA µ CON VARIANZA CONOCIDA............ 144
7.4 COMPORTAMIENTO DE LOS INTERVALOS DE CONFIANZA ........................ .148
7.5 TAMAÑO DE LA MUESTRA PARA ESTIMAR µ ............................................... .149
7.6 INTERVALOS DE CONFIANZA PARA µ CON VARIANZA DESCONOCIDA... .149
7.7 INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL ...... 151
7.8 TAMAÑO DE LA MUESTRA PARA ESTIMAR P ................................................ .151
7.9 INTERV. DE CONFIANZA PARA LA VARIANZA DE UNA POB.NORMAL ........ 153
7.10 EJERCICIOS PROPUESTOS ........................................................................... .155
7.11 EJERCICIOS RESUELTOS................................................................................ 157

143
7 INTERVALOS DE CONFIANZA
7.1 INTRODUCCIÓN
Inferir significa sacar conclusiones. La inferencia estadística nos proporciona métodos para
sacar conclusiones sobre una población a partir de los datos que surjan de una muestra de
dicha población, utilizando la probabilidad para expresar la fuerza de nuestras conclusiones.
Los dos procedimientos más ampliamente utilizados de inferencia estadística son: la
construcción de un intervalo de confianza cuando el objetivo sea estimar un parámetro
poblacional y la prueba de hipótesis, cuando el objetivo sea tomar una decisión respecto de
una hipótesis que se formula sobre el valor de un parámetro poblacional.
Los dos tipos de inferencia se basan en las distribuciones de los estadísticos desarrolladas en
el capítulo 6. El trabajo que hicimos en el mismo se caracterizó por partir de una población
conocida y desde ella observar como se distribuyen los estadísticos: media, varianza y
proporción muestral.
Como se mencionó, sólo cuando se utiliza el azar para escoger los elementos que conforman
una muestra, podemos describir cómo varía el estadístico. Pudimos contestar preguntas como
¿qué tan cercana queda la media de la muestra X , de la media de la población µ?
En este capítulo y en el próximo vamos a invertir el argumento. A partir de una muestra
conocida que se ha extraído de una población ¿qué se puede concluir acerca de los
parámetros desconocidos de la misma? Este proceso involucra una inducción, o inferencia
estadística: ir de lo particular (muestra) a lo general (población). Siempre nos basaremos en
datos que proceden de una muestra aleatoria simple de una población.
Elegiremos para inferir buenos estimadores: estimadores insesgados del parámetro

poblacional desconocido y convergentes al mismo (pág. 134, capítulo 6).
7.2 INTERVALOS DE CONFIANZA
Si no se conoce el valor de un parámetro poblacional, el mismo se puede estimar a partir de un

intervalo de confianza para dicho parámetro.
A todo intervalo de confianza, calculado a partir de los datos de una muestra aleatoria, se le fija
un nivel de confianza que mide la probabilidad de que el intervalo contenga el verdadero valor
del parámetro.
Por ejemplo: un intervalo para un parámetro poblacional, calculado con un 95% de confianza,
es un intervalo que tiene una probabilidad de 95% de contener el verdadero valor del
parámetro.
El objetivo de este capítulo es describir los razonamientos utilizados en la construcción de un
intervalo de confianza. Podremos estar interesados en estimar µ, σ2 o p, obteniendo una
medida de la precisión de la estimación y otra sobre cuál es nuestra confianza de que el
resultado sea correcto, como veremos seguidamente.
144
Nos apoyaremos en un ejemplo de estimación del parámetro desconocido µ, cuando los datos
son una muestra aleatoria simple de tamaño n. El intervalo se basa en el hecho de que la
distribución de la media muestral X es normal o aproximadamente normal, como se vio en el
capítulo 6.
7. 3 Intervalo de confianza para la media poblacional con varianza conocida
En el capítulo anterior, suponíamos conocida la media poblacional µ y estudiamos para

muestras de distintos tamaños, qué tan cerca o lejos podía esperarse encontrar el valor de la
media muestral X .
Por ejemplo, si se considera una población normal donde µ = 4.5 y la desviación poblacional
σ=1, y se extraen muestras de tamaño 100, la variable promedio muestral se distribuye
normalmente con esperanza 4.5 y desviación estándar 1/10. En símbolos:
X ∼ N (4.5 ; 1/10)
¿Entre qué valores se encuentran el 95 % de los promedios muestrales centrales? Es decir

buscamos los valores X1 y X 2 que satisfagan:
P ( x1 ≤ X ≤ x 2 ) = 0.95
⎛ ⎞ ⎛ ⎞
⎜ x −µ x2 − µ ⎟ ⎜ x − 4 .5 x − 4 .5 ⎟
P⎜ 1 ≤ Z≤ ⎟ =P⎜ 1 ≤ Z≤ 2 ⎟=
⎜ σ σ ⎟ ⎜ 1 1 ⎟
⎝ n n ⎠ ⎝ 100 100 ⎠
P ( −1.96 ≤ Z ≤ 1.96) = 0.95
X
x1 4 .5 x2
145
Z
-1.96 0 1.96
Luego:
x 1 - 4.5
= − 1.96 ⇒ x 1 = 4.304
1
10
x 2 - 4.5
= 1.96 ⇒ x 2 = 4.696
1
10
Es decir P ( 4.304 ≤ X ≤ 4.696 ) = 0.95
por lo tanto, el 95 % de los promedios muestrales estarán entre 4.304 y 4.696:
4,304 4,5 4,696 X
⎛ σ σ ⎞
En general : P ⎜⎜ µ − 1.96 ≤ X ≤ µ + 1.96 ⎟ = 0.95
⎟
⎝ n n ⎠
Supongamos ahora que la media poblacional µ es desconocida y se conoce la desviación

estándar poblacional σ. Entonces, invirtiendo µ por la media muestral X resulta:
⎛ σ σ ⎞
P ⎜⎜ X − 1.96 ≤ µ ≤ X + 1.96 ⎟ = 0.95 1
⎝ n n ⎟⎠
146
Esta expresión es el intervalo aleatorio, a partir del cual se estima la µ desconocida.

Se debe tener cuidado en la interpretación de 1. El promedio poblacional no se ha convertido
en una variable, sigue siendo una constante de la población. Los límites del intervalo sí son
aleatorios ya que dependen de la variable aleatoria promedio muestral.
Cuando se selecciona una muestra, los límites dejan de ser aleatorios dado que obtenemos un
valor del promedio de la muestra seleccionada y en consecuencia hablamos de un intervalo
de confianza de 95% para el promedio poblacional
⎛ σ σ ⎞
ICµ = ⎜⎜ x - 1.96 ; x + 1.96 ⎟
⎝ n n ⎟⎠
Aunque en la práctica sólo se selecciona una sola muestra de tamaño n y se calcula el

promedio muestral X para dicha muestra, es necesario pensar en el conjunto hipotético de
todas las muestras posibles, cada una del mismo tamaño n, a fin de entender el significado del
intervalo de confianza.
Supongamos las siguientes situaciones para una muestra extraída de tamaño 100:
La media muestral resulta igual a 4,35. Luego el intervalo de confianza para µ es:
X ± 1.96 σ = 4.35 ± 1.96 1 = 4.35 ± 0.196

n 100
Este intervalo (4.154 ; 4.546) contiene a la media poblacional µ = 4.5. Esta muestra nos
llevaría a decir que 4,5 es un valor posible de µ.
La media muestral resulta igual a 4.6. El intervalo de confianza obtenido a partir de este
valor :(4,404 ; 4.796), también nos llevaría a decir que 4,5 es un valor posible de µ.
valor: (4.052 ; 4.446) no contiene al parámetro; nos llevaría a decir que 4,5 no es un valor
posible de µ.
valor: (4.108 ; 4.5) nos llevaría a decir que 4,5 es un valor posible de µ.
147
Todas estas situaciones se pueden visualizar en la figura siguiente:
4.304 4,5 4.696
X1 = 4.35 4.154 4.35 4.546

X 2 = 4.6 4.404 4.6 4.796
X 3 = 4.25
4 052 4 25 4 446
X 4 = 4.30
4.108 4.304 4.5
O sea que para algunas muestras, el intervalo de confianza contiene al verdadero valor de µ,
mientras que para otras no.
En este ejemplo, siempre que x esté situada a una distancia de a lo sumo 0.196 de µ, el
intervalo cubrirá al verdadero valor del promedio poblacional y esto sucederá en un 95 % de
todas las muestras posibles.
La semiamplitud del intervalo de confianza se conoce como error de estimación y es una

medida de la precisión de la estimación. En el ejemplo se trabaja con un error de estimación
para un intervalo de 95 % de confianza igual a 0.196.
ε = 1 . 96 σ = 1 . 96 1 = 0 . 196 .
n 100
En la práctica sólo se selecciona una muestra y se desconoce µ. Nunca se sabe con seguridad
si el intervalo obtenido incluye la media poblacional. Por ej. si se extrae una muestra y su
media resulta igual a 4,6 decimos que tenemos una confianza de 95 % de que la media
poblacional desconocida se encuentre en el intervalo (4.404 ; 4.796). Este intervalo es el que
varía en función de la muestra que sale seleccionada. El valor del parámetro es único.
Si a partir del mismo ejemplo se hubiera trabajado con una confianza de 99%, el error de
estimación resultaría
ε = 2 . 58 σ = 2,58 1 = 0 . 258
n 100
148
En general, para una confianza de 100 (1-α) % el error de estimación resulta:1
ε = zα σ
n
Y el intervalo de confianza para la media poblacional con varianza conocida es:
⎛ σ σ ⎞
ICµ = ⎜⎜ x - z α ; x + zα ⎟⎟
⎝ n n⎠
Si la población es Normal, no interesa el tamaño de la muestra aleatoria que se selecciona

para estimar µ. Si la población no es Normal, se necesita un tamaño de muestra de por lo
menos 30 observaciones (Teorema Central del Límite) para usar la expresión anterior del
intervalo de confianza.
7.4 Comportamiento de los intervalos de confianza

El intervalo de confianza para la media de una población ilustra algunas de las propiedades
importantes que son compartidas por todos los intervalos de confianza de uso frecuente.
El que realiza dicho intervalo elige el nivel de confianza con que quiere trabajar y el error de
estimación depende de esta decisión. Por supuesto que se desearía tener un nivel de
confianza alto (significa que casi siempre daremos respuestas correctas) y un error de
estimación pequeño (significa que la estimación del parámetro poblacional es bastante
precisa); pero no siempre esto se logra alcanzar.
El error de estimación para la media de una población que se distribuye normal es:
σ
ε = zα
n
Esta expresión tiene z y σ en el numerador y n en el denominador. Por lo tanto, el error de

estimación se hace menor cuando:
z es menor. Una z menor es lo mismo que un nivel de confianza menor. Existe una
relación directa entre el nivel de confianza y el error de estimación. Para el mismo tamaño
de muestra, para tener un error de estimación menor, hay que aceptar una confianza
menor.
n se hace mayor. Existe una relación inversa entre el tamaño de muestra y el error de
estimación. Un incremento del tamaño de la muestra n reduce el error de estimación para
un nivel de confianza determinado
1
zα es el valor de la normal estandarizada correspondiente a un nivel de confianza (1- α) elegido en la estimación
149
σ es menor. La desviación estándar σ mide la variación de la población. A diferencia de

los puntos anteriores, σ es un parámetro de la población que sólo puede modificarse
actuando sobre la población.
7.5 Tamaño de la muestra para estimar µ

Siempre es necesario planificar la inferencia conjuntamente con la obtención de los datos.
σ
Si el error de estimación para la media es: ε = zα
n
El tamaño de muestra para un error de estimación ε y un nivel de confianza determinado se

deduce de la ecuación anterior, resultando:
2
⎛ σ⎞
n = ⎜ zα ⎟
⎝ ε⎠
Es importante tener claro que lo que determina el tamaño de la muestra es el error de

estimación y la confianza que se pretende para realizar la estimación y no el tamaño de la
población, ya que éste no influye sobre el tamaño de muestra que se necesita para la
inferencia.
Esta fórmula2 no se puede utilizar ligeramente. En la práctica la obtención de observaciones
cuesta tiempo y dinero. Puede ocurrir que el tamaño de la muestra ideal sea inviable por
razones económicas y/o de otro tipo.
7.6 Intervalo de confianza para la media con varianza desconocida
En el punto anterior estimamos el promedio poblacional suponiendo la desviación estándar

poblacional conocida. En la práctica, es poco probable conocer el valor de σ.
En el capítulo 6 (pág. 133), vimos que si la población de la cual se extraen las muestras es
normal, con media poblacional µ y desvío estándar poblacional σ desconocido, se reemplaza
σ por S (desvío muestral) y la estadística (X − µ ) deja de tener distribución normal

S/ n
estandarizada y tiene una distribución t Student con n-1 grados de libertad, es decir:
(X − µ ) ∼ t
n −1; α
S/ n
2
Redondea siempre n hacia arriba cuando uses esta fórmula.
150
En el punto 7.3, para obtener un intervalo de confianza para el promedio poblacional cuando
σ era conocida trabajamos con la variable normal estandarizada (zα). Ahora trabajaremos
con la variable t de Student ( t n −1; α )3.
En consecuencia, para una confianza de 100 (1-α) % el error de estimación resulta:
ε = t n − 1; α s
n
Y el intervalo de confianza para la media poblacional con varianza desconocida es:
⎛ s s ⎞
ICµ = ⎜⎜ x - t n −1;α ; x + t n −1;α ⎟
⎝ n n ⎟⎠
Resumen de procedimientos de estimación de intervalos de confianza para la

media poblacional
¿Es
Sí Grande n No
(n ≥30)?
¿Se No
Sí ¿Es
conoce el
Sí aproximadamente No
valor de σ?
normal la
población?
Usar la desviación
estándar de la
muestra s
para estimar σ ¿Se
Sí No
conoce el valor
de σ?
Usar la desviación
estándar de la
muestra s
para estimar σ
Aumentar el tamaño de
Usar Usar la muestra a
σ s n ≥ 30 para determinar
x ± zα x ± zα
n n un intervalo de
confianza
Usar Usar
σ s
x ± zα x ± tα
n n
3
Obtener los valores tn-1 en la tabla 2.5 del Apéndice.
151
7.7 Intervalo de confianza para la proporción poblacional
En el capítulo 6 (punto 6.4, pág. 135) estudiamos la distribución del estadístico frecuencia
relativa o proporción muestral. Si n es “suficientemente” grande, la distribución de pˆ = f r se
comporta aproximadamente como una distribución normal con media p y desviación estándar
p(1 − p)
, es decir:
n
) ⎛ p(1 - p) ⎞⎟
p es aproximadamente N ⎜ p ;
⎜ n ⎟⎠
⎝
Con el mismo razonamiento que empleamos en la estimación de la media poblacional, el

planteo inicial para estimar la proporción poblacional o probabilidad de un suceso cualquiera
A, es encontrar dos valores pˆ 1 y pˆ 2 que verifiquen:
P( p̂1 ≤ p̂ ≤ p̂ 2 ) = 0.95
Estandarizando:
p̂ − p
P( − 1.96 ≤ ≤ 1.96) = 0.95
p(1 − P)
n
A esta expresión la podemos escribir de la siguiente forma:
p(1 − p) p(1 − p)
P( p̂ − 1.96 ≤ p ≤ p̂ + 1.96 ) = 0.95
n n
p(1 − p)
La desviación poblacional de la proporción muestral queda en función del
n
parámetro desconocido p, sin embargo una solución satisfactoria (para un tamaño de
muestra grande: n ≥ 100) es reemplazar p por su estimador p̂ quedando:
p̂(1 − p̂ ) p̂(1 − p̂ )
P ( p̂ − 1 .96 ≤ p ≤ p̂ + 1 .96 ) = 0 . 95
n n
Y en consecuencia el Intervalo de confianza para la proporción poblacional para un nivel de

confianza de 100 (1- α ) % es:
⎛ p̂(1 − p̂) p̂(1 − p̂) ⎞⎟

IC p,(1−p) = ⎜ p̂ − zα ≤ p ≤ p̂ + zα
⎜ n n ⎟
⎝ ⎠
152
A partir de esta expresión el error de estimación resulta:
pˆ (1 − pˆ )
ε = zα
n
7.8 Tamaño de la muestra para estimar p
El tamaño de muestra n para un error de estimación ε y un nivel de confianza de 100 (1- α)%,
se deduce de la ecuación anterior, resultando :
zα 2
n= ( ) p (1 − p )
ε
Para utilizar la fórmula anterior se necesita reemplazar a p por una estimación de la misma.
Ésta se puede obtener:
• de la estimación de la proporción muestral en una muestra anterior
• calculando p̂ en una muestra preliminar (o piloto)
Si estas alternativas no son posibles, otra forma para calcular el tamaño de la muestra
requerida, es considerar que siempre p.(1 – p) es máximo para p = 0,5. Es decir, que una cota
superior para n (para una confianza de 100 (1- α) % y un error ε está dada por:
zα 2
n= ( ) ( 0.25)
ε
Ejemplo :
Una empresa de cable desea conocer qué proporción de sus clientes se informan de las
noticias a través de los noticiarios que difunden. Para ello seleccionó una muestra aleatoria de
200 clientes. De las 200 personas, 110 respondieron que se informan a través de los noticieros
televisivos. El intervalo obtenido para una confianza de 95% resultó:
0.55 * 0.45 0.55 * 0.45

ICp,95% = ( 0.55 − 1.96 ≤ p ≤ 0.55 + 1.96 )=
200 200
= 0.55 − 0.07 ≤ p ≤ 0.55 + 0.07 = (0.48 ; 0.62)
Es decir que con una confianza de 95 % se puede inferir que la proporción de clientes que se
informan a través de los noticieros se encuentra entre el 48 y el 62%.
La empresa considera que el error de estimación es alto y por lo tanto, este intervalo no le
brinda demasiada información.
153
A tal fin decide consultar a más clientes. El tamaño de muestra que lo llevaría a cometer un
error de 4%, con la misma confianza, y utilizando la proporción muestral ya obtenida, resulta:
2 2
⎛z ⎞ ⎛ 1 .96 ⎞
n = ⎜⎜ α ⎟⎟ p̂(1 − p̂ ) = ⎜ ⎟ 0 .55 * 0 .45 = 594 .25
⎝ ε ⎠ ⎝ 0 .04 ⎠
Es decir que se necesita un tamaño de muestra mayor o igual a 595 clientes.
7.9 Intervalo de confianza para la varianza poblacional una distribución

normal
En el capítulo 6 (punto 6.5, pág 136) estudiamos la distribución de la varianza muestral S2. Si la
población de la cual se extraen las muestras es normal, la variable ( n − 1) S 2 tiene una
σ2
distribución ji cuadrado ( χ 2 ) con (n - 1) grados de libertad
(n− 1) S 2 2
2
∼ χ n -1
σ
Nuestro planteo inicial es ahora encontrar dos valores de la distribución χ 2 ( χ a2 y χ b2 ) que

verifiquen:
2 (n− 1) S 2 2 2 2
P ( χa < < χ b ) = 1 - α (Los valores χ a y χ b se obtienen en la tabla 2.6 del Apéndice
σ2
y dependen del tamaño de la muestra n).
Trabajando algebraicamente la expresión anterior obtenemos:
(n − 1) S 2 (n − 1) S 2
P( ≤ σ2 ≤ ) = 1- α
χ2 χ2
b a
Es decir que el intervalo de confianza para la varianza poblacional de una población normal
(σ2) con una confianza de 100 (1 - α )% resulta :
⎛ ⎞
⎜ (n − 1) S 2 (n − 1) S 2 ⎟
I.C.σ 2 ,(1− α ) = ⎜ ; ⎟
⎜ χ2 χ2 ⎟
⎝ b a ⎠
Ejemplo:
En un criadero de peces se crían truchas para aprovisionar ríos y lagos. El peso del pez en el
momento que es liberado se puede controlar variando la alimentación. El criadero espera una
desviación estándar de 21,5 gramos en el peso de los peces. Para evaluar si el plan de
alimentación que se aplica cumple lo deseado, se toma una muestra de 25 peces
154
obteniéndose una desviación para el peso de 28.9 gramos. El intervalo de 95% de confianza
para la varianza poblacional resulta:
⎛ ( 25 − 1) 28.9 ( 25 − 1) 28.9 ⎞
I.C.σ 2 , 0.95 = ⎜ ; ⎟ = ( 509.27 ; 1616.54 )
⎝ 39.36 12.4 ⎠
Es decir, que con un 95% de confianza, el desvío estándar poblacional se encuentra en el

intervalo (22.57 ; 40.21). Por lo tanto se concluye, con un 95 % de confianza, que el desvío
estándar del peso de los peces es superior al deseado por el criadero.
155
1.- En un conocido restaurante se cree que los tiempos de espera (en minutos) de sus clientes se
distribuyen de manera normal con una varianza de 22,5 minutos 2.
a) Una muestra de 25 clientes reveló un tiempo medio de espera de 13 minutos. Construya el
intervalo de confianza del 95 % para la media de la población.
b) Suponga que la media de 13 minutos resultó de una muestra de 32 clientes. Encuentre el
intervalo de confianza del 95 % para la media de la población.
c) ¿Qué efecto tiene un mayor tamaño de muestra sobre el intervalo de confianza?
2.- Se tiene interés en estimar la vida media de un producto nuevo. ¿Qué tan grande debe ser la
muestra que debe tomarse para estimar la media, con un error no mayor de 1/10 de la
desviación estándar y con una confianza del 90%?
3.- La Cámara de Comercio de una ciudad desea estimar el gasto medio por turista que visita
dicha ciudad durante un período determinado. Con ese objetivo se ha elegido una muestra al
azar de 100 turistas y se ha hallado que x = 800 $. Se conoce de experiencias anteriores que
la desviación estándar de los gastos por turista en ese período es de 120 $.
a) Construir un intervalo de 95 % de confianza de para el gasto medio
b) ¿Cómo debe modificarse el tamaño de la muestra si se desea aumentar el grado de
confianza a 99% sin aumentar el error de estimación obtenido en el punto a)?
4.- Una persona afirma que su curso de preparación para agentes de seguros de vida permite a una
compañía contratar más pólizas que la compañía “promedio”. El monto mensual de
contratación de todos los agentes de seguros tiene un comportamiento normal con promedio
de $100.000. Una muestra de 10 agentes que siguieron el curso de preparación dio los
siguientes resultados (en miles de pesos):
100 120 130 120 125 a) Si Ud. fuera el supervisor de los agentes
90 130 135 140 110 ¿adoptaría el curso propuesto por esa persona?
b) ¿Qué conclusión se puede extraer si se piensa que σ2 = 260? ¿Considera que estos datos
son suficientes para obtener una buena conclusión?
5. El departamento de servicio a clientes de la compañía de gas para viviendas desea estimar la

dispersión del período que transcurre entre la llegada de una solicitud de servicio y la
conexión del mismo. El departamento considera que si la compañía trabajó según lo
convenido, la desviación estándar de dicho período no debe ser mayor a 19 días. Se seleccionó
una muestra aleatoria de 15 casas a partir de los registros disponibles del año anterior. Los
resultados registrados sobre el tiempo transcurrido entre solicitud y conexión fueron:
114 78 96 137 78 103 117 ¿A que conclusión llegará el

126 86 99 114 72 104 73 86 departamento? (suponga distribución
normal para la variable en estudio)
156
6.- Una compañía telefónica desea conocer la proporción de aparatos que necesitan reparación
sobre el total de los instalados. ¿Cuál es el mínimo tamaño de muestra necesario para estimar
dicha proporción con un error de a los sumo 0,01 y con un coeficiente de confianza igual a
0,95?
7.- Una muestra aleatoria de los puntajes de 100 aspirantes a puestos de mecanógrafos, en una
gran compañía de seguros, presentó un puntaje medio de 72,6. El diseñador de la prueba
sostiene que los aspirantes calificados deben promediar por lo menos 75 puntos. Suponga
que la desviación estándar de los puntajes de la prueba es de 10,5.
¿Puede concluir la compañía de seguros que está contratando aspirantes calificados,
teniendo en cuenta los resultados de esta prueba?
8.- La administración de un supermercado desea conocer el tiempo promedio que emplean sus
clientes para realizar sus compras. Para obtener dicha información se va a estudiar una
muestra al azar de clientes. A partir de experiencias pasadas en tiendas similares se ha
estimado que la desviación estándar de la variable en estudio se encuentra entre 5 y 10
minutos.
a) ¿Qué tamaño de muestra aconsejaría si se admite un error de estimación de 1 minuto?
(trabaje con 95 % de confianza).
b) Suponga que de una muestra al azar de 200 clientes se obtuvo un x = 19,56 minutos y una
dispersión del tiempo que los clientes permanecieron en la tienda de 6,6 minutos.
En supermercados comparables el tiempo medio empleado por los clientes es de 25
minutos ¿Podría concluirse que la tienda en la cual se realizó el estudio difiere de las otras
con respecto al tiempo promedio que emplean los clientes?
9.- Un fabricante de disquetes para computadoras personales está preocupado por el número de
sectores dañados que se registran cuando se formatea un disco en una computadora
particular. Para investigar sobre las características de la producción, se selecciona una
muestra de 100 disquetes de la producción diaria, se les da formato y se registra el tamaño
(en miles de bytes) de los sectores dañados de cada disco. En la tabla siguiente se presenta la
distribución de frecuencias del tamaño (en miles de bytes) de los sectores dañados en las
unidades correspondientes a la muestra seleccionada.
Sector dañado a) Estime, en promedio, el tamaño de los sectores

nº de discos
(en miles de bytes)
dañados de los discos. Interprete los valores hallados.
0.4 < x ≤ 5.2 2
5.2 < x ≤ 10.0 11 b) El fabricante está preocupado por la proporción de
10.0 < x ≤ 14.8 12 discos cuyos sectores dañados superan los 19.600
14.8 < x ≤ 19.6 13 bytes. ¿Qué se puede inferir respecto a esto?
19.6 < x ≤ 24.4 17
24.4 < x ≤ 29.2 13
29.2 < x ≤ 34.0 12
34.0 < x ≤ 38.8 10
38.8 < x ≤ 43.6 9
43.6 < x ≤ 48.4 1
157
7.11 EJERCICIOS RESUELTOS
1.- Suponga una variable X con distribución normal y Var (X) = 4. Al extraer una muestra de 25
observaciones se obtiene x = 78,3. Obtenga un intervalo de confianza para E(X).
a) del 95 % de confianza
b) del 99 % de confianza
c) Analice los intervalos obtenidos
Solución
X −µ
Si X ∼ N(µ,σ) siendo σ conocido, entonces n ∼ N(0,1)
σ
⎡ σ σ ⎤
El intervalo aleatorio para E(x) es en este caso: IAµ = ⎢ X − z ;X + z ⎥
⎣ n n⎦
El valor de z se obtiene de la tabla de la distribución normal y depende del nivel de confianza
fijado.
a) Para un nivel de confianza de 0,95 el valor de z = 1,96.
⎡ 2 2 ⎤
El intervalo de confianza correspondiente es: ICµ = ⎢78.3 − 1.96 ; 78.3 + 1.96 ⎥
⎣ 25 25 ⎦
ICµ = (77.516 ; 79.084)
b) Para un nivel de confianza 0,99; el valor correspondiente de z es 2,58, de donde:

⎡ 2 2 ⎤
ICµ = ⎢78.3 − 2.58 ; 78.3 + 2.58 ⎥
⎣ 25 25 ⎦
ICµ = (77.268 ; 79.332)
c) Si comparamos los intervalos obtenidos en a) y b), observamos que al aumentar el nivel

de confianza, aumenta la amplitud del intervalo, es decir, el error de estimación (ε) es
mayor. Esto significa que disminuye la precisión de la estimación.
2.- Una empresa de alta tecnología desea estimar el número medio de años de educación superior
terminados por sus empleados. Una estimación aceptable de la desviación estándar del
número de años de educación superior es 1 año. ¿Cuál debe ser el tamaño de la muestra para
estimar µ con un error de estimación menor a 0,3 años y un 95 % de confianza?
Solución
Si suponemos que la variable X: número de años de educación superior terminados, se
distribuye normalmente, se tiene
⎛ σ ⎞ σ
P ⎜⎜ X − µ < z ⎟⎟ = 0.95 ⇒ z = 1.96 luego ε=z = 0.3 ⇒ n ≥ 43
⎝ n⎠ n
Una vez determinado el tamaño de la muestra y siendo en ésta n ≥ 43, la normalidad de la
variable X o su aproximación a la distribución normal es consecuencia del Teorema Central
158
del Límite. Si el n obtenido hubiese sido pequeño, la normalidad de X es válida únicamente

si las observaciones realizadas son independientes y provenientes de una población normal
(propiedad reproductiva de la distribución normal).
3.- De una población normal N(µ, σ) = N(µ, 4) se extrae una muestra de n = 16 elementos. Se
construye un intervalo de confianza para E(X) obteniéndose: ICµ = (7,63; 12,77). Si la media
muestral fue 10,2 ¿con qué confianza el intervalo anterior cubre el verdadero valor del
parámetro?
Solución
Para conocer el nivel de confianza se debe encontrar el valor de z de modo que verifique que:
σ σ
x − zα = 7,63 o bien x + zα = 12.77
n n
Para x = 10.2 y σ =4 se obtiene para una muestra de 16 elementos un zα= 2.57,
luego
α = 0.01, por lo tanto el nivel de confianza con que el intervalo cubre el verdadero valor de
la media poblacional es del 99 %.
4.- Sea X una variable aleatoria distribuida normalmente. De una muestra de tamaño n = 25 se
obtiene x = 125 y s = 3,5. Halle:
a) Un intervalo de 95% de confianza para E(X).
b) Un intervalo de 95% confianza para σ2.
Solución
X −µ
a) Si X ∼ N(µ,σ) siendo σ desconocido, entonces n ∼ t n-1
S
⎡ S S ⎤
El intervalo aleatorio para E(X) es en este caso: IAµ = ⎢ X − t n −1 ; X + t n −1 ⎥
⎣ n n⎦
El valor tn-1 se obtiene de la tabla de la distribución t de Student y depende del tamaño de la

muestra y del nivel de confianza fijado.
En este caso α = 0.05 y n-1= 24, de donde t 24; 0,025 = 2.064
⎡ 3.5 3.5 ⎤
El intervalo de confianza correspondiente es: ICµ = ⎢125 − 2.064 ; 125 + 2.064 ⎥
⎣ 25 25 ⎦
ICµ = (123,56 ; 126,45)
S2
b) Si X ∼ N(µ,σ) entonces ( n − 1) ∼ χ2n-1
σ 2
⎡ (n − 1) S 2 (n − 1) S 2 ⎤
El intervalo aleatorio para σ2(X) es en este caso: IAσ2 = ⎢ ; ⎥
⎣ C2 C1 ⎦
159
Los valores C1 y C2 se obtienen de la tabla de la distribución chi cuadrado y dependen del

tamaño de la muestra y del nivel de confianza fijado.
En el ejemplo, el intervalo de confianza correspondiente es:
⎡ 24 . 12,25 24 . 12,25 ⎤
ICσ2 = ⎢ ;
⎣ 39,37 12,4 ⎥⎦
ICσ2 = ( 7,47 ; 23,71 )
5.- Durante cierta semana una gran tienda observó y registró que 5.750 de las 12.500 personas
que entraron en la tienda hicieron por lo menos una compra. Tratando esto como una muestra
al azar de todos los clientes potenciales:
a) calcular un intervalo de confianza del 99% para la proporción real de personas que entran
en la tienda y que hacen por lo menos una compra.
Solución
Sea el suceso A: una persona que entra a la tienda realiza por lo menos una compra y
P(A) = p
Se define la variable X: número de personas entre n, que entran a la tienda y realizan por lo
menos una compra.
X
La variable aleatoria fA = para n suficientemente grande tiende a distribuirse →
n
⎛ p (1 − p ) ⎞
N ⎜p; ⎟;
⎝ n ⎠
para n >100, un intervalo de confianza aproximado del parámetro p es de la forma:
⎡ f A (1 − f A ) f A (1 − f A ) ⎤
⎢ fA − z ; fA + z ⎥
⎣⎢ n n ⎦⎥
5750
Como fA = = 0,46 se obtiene
12500
⎡ 0,46 0,54 0,46 . 0,54 ⎤
ICp = ⎢0,46 − 2,58 ; 0,46 + 2,58 ⎥
⎣ 12500 12500 ⎦
ICp = (0,45 ; 0,47)
6.- Una fábrica de cera para pisos tiene vendedores en todo el país, que ganaban una comisión
promedio de $600 por mes. Con la llegada al mercado de nuevas marcas disminuyó el
volumen de ventas y para compensar la pérdida de ingresos se agregó otro producto a los
vendedores. La gerencia está interesada en conocer el efecto neto de los dos cambios en la
comisión de los vendedores. Se tomó una muestra de 100 vendedores y se obtuvo una
160
comisión promedio de $585 y desvío de $70. Suponiendo que el ingreso por comisión tiene
una distribución normal ¿se registraron cambios en el promedio de las comisiones?
Solución
Para valores grandes del tamaño de muestra (n), la función de densidad de la distribución t de
Student tiende a distribuirse como una variable normal estandarizada N (0,1). Siendo en el
ejemplo n=100, utilizaremos la distribución normal en lugar de la distribución t para estimar
µ. Para ello supondremos σ conocido e igual a s. Para un nivel de confianza de 95% se
⎡ 70 70 ⎤
obtiene para µ el intervalo: ⎢585 − 1.96 ; 585 + 1.96 ⎥ = [571.28 ; 598.72]
⎣ 100 100 ⎦
Esto permite concluir con 95% de confianza que el promedio de las comisiones disminuyó a
pesar de los cambios introducidos.
8. TEST DE HIPÓTESIS
CONTENIDO
8.1 INTRODUCCIÓN .................................................................................................. 162
8.2 HIPÓTESIS NULA Y ALTERNATIVA................................................................... 162
8.3 PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL Μ .......................... 164
8.4 ERROR TIPO I Y ERROR TIPO II ......................................................................... 166
8.5 CONSTRUCCIÓN DE LA REGLA DE DECISIÓN ................................................ 167
8.6 CÁLCULO DEL TAMAÑO DE MUESTRA............................................................ 171
8.7 ENFOQUE DEL VALOR P PARA LAS PRUEBAS DE HIPÓTESIS..................... 172
8.8 EJERCICIOS PROPUESTOS............................................................................... 173

162
8. TEST DE HIPÓTESIS
8.1 INTRODUCCIÓN
En el capítulo anterior se describió el procedimiento de estimar, en base a una muestra

aleatoria, el valor de un parámetro de la población, desarrollando un rango de valores dentro
del cual se espera, con cierta probabilidad, esté contenido el verdadero valor del parámetro.
Otro de los procedimientos de inferencia estadística ampliamente utilizado es valorar la
evidencia muestral a favor de alguna hipótesis que se enuncia acerca de una población. Este
procedimiento recibe el nombre de test o prueba de hipótesis.
En general, para las pruebas de hipótesis que veremos en el curso, el test de hipótesis es sólo
otra forma de tomar una decisión a la cual se podría haber arribado con un intervalo de
confianza para el parámetro en cuestión.
8.2 HIPÓTESIS NULA Y ALTERNATIVA

¿Qué es una hipótesis?
Es una afirmación acerca de la población; por ejemplo, que un parámetro de la misma tiene un
valor específico ( µ = 5, σ = 2, p = 0.05) 1.
Es una suposición que se hace en función de la sospecha sobre lo que realmente está
ocurriendo en la población.
La comprobación de esta sospecha debería hacerse estudiando toda la población, pero ya se
ha visto que en la mayoría de los problemas, esto es impracticable.
Para ello, se utilizan las pruebas de hipótesis, como un procedimiento de inferencia estadística
que se basa en la evidencia muestral y en la teoría de probabilidad para determinar si la
hipótesis es un enunciado razonable para la población en estudio.
Cuando se observan los datos obtenidos en una muestra, éstos, en general sugieren que algo
específico está sucediendo en la población de la cual se ha obtenido la muestra. La pregunta
es si ese resultado o efecto aparente observado en la muestra, es realmente un indicio de lo
que ocurre en la población en cuestión o solamente es fruto de una variación aleatoria.
Las pruebas estadísticas de hipótesis constituyen una manera de estimar si ese efecto
aparente indica lo que en la realidad está ocurriendo.
La conclusión siempre estará referida a una población y por lo tanto, como primer paso, debe
establecerse claramente cuál es la población en estudio y seguidamente, identificar el
parámetro sobre el que tomamos la decisión.
Estructura del problema

En el procedimiento de prueba se concentra la atención en dos conjuntos posibles de valores
del parámetro, o dos hipótesis estadísticas, ambas opuestas. Se las llama hipótesis nula e
hipótesis alternativa.
1
Podríamos preguntarnos también acerca de la forma de la población y hacer supuestos (hipótesis) sobre ella (Test
de Bondad de Ajuste). Pero esta situación no será trabajada en la asignatura.
163
Hipótesis nula (H0): es la creencia convencional, afirma que no hay ningún cambio o
efecto en la población.
Hipótesis alternativa (Ha): representa el efecto que se sospecha puede ser cierto.
Establece que un determinado parámetro difiere del valor que le otorga la hipótesis
nula.
¿Cómo decidir si sustentamos lo especificado por la hipótesis nula o lo rechazamos?
La base del procedimiento es analizar la evidencia muestral y valorar si la misma es tan

improbable bajo la hipótesis nula, que ésta debería ser rechazada.
En forma sencilla, el proceso de la toma de decisiones es de la siguiente manera:
Se plantean dos hipótesis sobre una población de interés: H0 y Ha.
Para decidir cuál de estas dos hipótesis parece más razonable, recolectamos datos,
los analizamos y nos preguntamos: ¿son estos datos probables de ser observados
si H0 fuera cierta?
Si los datos son poco probables de ocurrir cuando H0 es cierta rechazo H0 y
sustentamos la otra teoría (Ha)2.
Las pruebas de hipótesis se proponen valorar la evidencia proporcionada por los datos
muestrales en contra de una hipótesis nula y a favor de la hipótesis alternativa.
Distintos planteos de pruebas de hipótesis para los parámetros de una población:
Considerando que θ es un parámetro de la población, y siendo θ0 un posible valor del

parámetro, se pueden plantear 3 tipos de pruebas:
a) Prueba bilateral o de dos colas
H0) θ = θ0 (El parámetro θ es igual a θ0), contra
Ha) θ ≠ θ0 (el valor de θ se ha modificado)
b) Prueba unilateral de cola izquierda
H0) θ ≥ θ0 (El parámetro θ es igual a θ0 o mayor), contra
Ha) θ < θ0 (el valor de θ ha disminuido)
c) Prueba unilateral de cola derecha
H0) θ ≤ θ0 (El parámetro θ es igual a θ0 o menor), contra
Ha) θ > θ0 (el valor de θ ha aumentado)
Observación: el signo igual aparece siempre en la hipótesis nula.
2
El no rechazo de la hipótesis nula no indica necesariamente que la hipótesis que se sustenta sea cierta, significa
que no hay evidencia suficiente para rechazarla.
164
Criterio de decisión
Para establecer si los datos muestrales son o no compatibles con H0, debe determinarse una
regla o criterio; este criterio se basa en la distribución muestral del estimador del parámetro
sobre el cual estamos planteando las hipótesis.
Se comienza suponiendo que H0 es cierta. Luego, si H0 es cierta, los valores del estadístico en
esta distribución, sólo indican una variación debida al azar.
La distribución muestral del estadístico, suponiendo cierta la hipótesis nula, brinda información
relativa a posibles valores que el estadístico asumirá en las muestras y las probabilidades
correspondientes, es decir, el porcentaje de muestras en que el estadístico asumirá
determinados valores en el conjunto de infinitas muestras posibles.
8.3 PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL µ
Ilustraremos la prueba de hipótesis para una media poblacional µ con un ejemplo:

Supongamos que una cadena de talleres de “servicio rápido” tiene un servicio estándar para
realizar cambios de aceite y verificar el funcionamiento básico del automóvil. Sus normas
establecen que el tiempo promedio para dar el servicio debería ser 12,5 minutos por automóvil,
pero la empresa desea mejorar el tiempo de atención, disminuyéndolo. El tiempo para dar el
servicio es una variable con distribución normal y de experiencias anteriores se ha determinado
que la desviación estándar es de 1,2 minutos. Para lograr disminuir el tiempo de atención se
decide realizar modificaciones en uno de los servicios.
Una disminución en los valores del tiempo para dar el servicio (X), significaría un corrimiento en
la distribución de probabilidad. Si el modelo persiste y el desvío es el conocido, entonces esta
disminución se verá reflejada en una disminución en el valor de µ.
Una vez realizadas las modificaciones, para determinar si el tiempo promedio de atención ha
disminuido, recurriremos a implementar una prueba de hipótesis.
1º paso:
Establecer:
Población: tiempo para dar el servicio ( X ) X ~ N (µ desconocido, σ= 1,2)
Parámetro: nos interesa saber si el cambio ha producido alguna disminución en el tiempo de
atención promedio, por lo tanto planteamos una decisión sobre µ.
2º paso:
Se establecen las hipótesis de la prueba
H0) µ ≥ 12,5
Ha) µ < 12,5
La hipótesis nula dice que no hay diferencias entre las dos condiciones de trabajo, lo que
implica que el tiempo promedio no se ha modificado. La hipótesis alternativa se establece como
el opuesto de la hipótesis nula y representa la conclusión deseada: el tiempo promedio de
atención disminuyó.
165
3º paso:
Establecer el estadístico, su distribución muestral y establecer el criterio para tomar la decisión.
El estimador del parámetro µ, ya sabemos que es el promedio muestral X cuya distribución
de probabilidad muestral, ya se ha estudiado. Podemos decir, entonces que es una distribución
normal con promedio µ, y desvío estándar σ .
n
En el ejemplo, suponiendo que el desvío estándar de la variable no se ha modificado, el desvío
estándar del promedio muestral es 1,2 , siendo n el tamaño de la muestra con la que se
n
trabajará.
Si suponemos cierta la hipótesis nula, entonces µ = 12,5 y X ~ N ( µ = 12,5; σ x = 1,2 )

n
Gráficamente3:
En base a esta distribución pueden observarse cuáles serían valores de Z más compatibles
con H0 y cuáles, en cambio, serían poco probables si ésta fuera la distribución que estaría
actuando (es decir si H0 fuera cierta):
⇒ Si el valor del estadístico obtenido en la muestra, x , fuese mucho menor que µ0 = 12,5,
x − 12.5
z = también sería mucho más pequeño respecto de E(z) = 0, y entonces
1,2
n
estaríamos en posición de suponer que este dato aporta evidencia en contra de que H0 es
cierta, ya que este valor no ocurriría casi nunca por azar si el verdadero valor de µ fuera
12,5. Por lo tanto, nos inclinamos a pensar que el efecto que se sospechó en el planteo, es
muy probable que exista ante esta evidencia.
Cuando rechazamos H0 a favor de Ha, se dice que los datos son estadísticamente
significativos.
“Los datos son estadísticamente significativos si ellos son poco probables de ser
observados bajo el supuesto de que H0 es cierta”
⇒ Si en cambio, el valor obtenido en la muestra no estuviera tan lejos de µ0 = 12,5, ese valor
podría ocurrir frecuentemente por azar cuando la media poblacional es 12,5 y entonces
decimos que no se puede rechazar H0 con esta evidencia.
3
Los gráficos del capítulo 8 fueron realizados por Natalia Anselmi, ayudante de la cátedra de Probabilidad y
Estadística de la carrera de ISI.
166
¿Cuán lejos deben estar los valores para rechazar H0?

¿Cómo determinar la regla de decisión?
El paso final para construir la regla o criterio de decisión consiste en asociar los valores del
estadístico que utilizamos para probar la hipótesis con la probabilidad de que ocurran
suponiendo cierta la hipótesis nula y decidir en consecuencia cuáles son los valores que nos
conducen al rechazo de la hipótesis nula (a favor de lo postulado por la hipótesis alternativa) y
cuáles son los valores no concluyentes para rechazarla.
No olvidemos:
Las hipótesis nula y alternativa son afirmaciones sobre la población que compiten entre
sí y las pruebas de hipótesis se basan en la información que brinda una muestra; por lo
tanto se debe considerar la posibilidad de errores.
La decisión se toma en base a datos muestrales y en consecuencia éstos pueden
llevarnos a decisiones erróneas.
¿Cuáles son esos errores y los riesgos asociados?
8.4 ERROR TIPO I Y ERROR TIPO II
Un diagrama de
errores y conclusiones correctas en prueba de hipótesis
la situación :
Población
H0 verdadera Ha verdadera
No rechazar H0 Decisión correcta Error de tipo II

Decisión
Rechazar H0 Error de tipo I Decisión correcta
En cualquier prueba de hipótesis pueden cometerse dos tipos de errores, que se denominan
error de tipo 1 ( eI ) y error de tipo 2 (eII ).
⇒ eI : es el error que se comete cuando la regla nos lleva a rechazar H0, cuando en
realidad es cierta.
⇒ eII : es el error que se comete cuando la regla nos lleva a no rechazar H0, cuando en
realidad es falsa.
En el contexto del ejemplo considerado:
⇒ eI : es el error que se comete si se concluye que el tiempo promedio de atención ha

disminuido cuando en realidad no disminuyó.
⇒ eII : es el error que se comete si se concluye que el tiempo promedio de atención no ha
disminuido cuando en realidad disminuyó.
167
Como es de notar, se habla de rechazar o no la H0, ya que es la única que se prueba y es

rechazada cuando los datos muestrales bajo la regla construida son demasiado poco probables
para el modelo poblacional bajo la H0.
Si bien no podemos eliminar la posibilidad de errores en la prueba de hipótesis, sí podemos

considerar la probabilidad de su ocurrencia y tratar de controlarlos.
Usaremos la siguiente notación para indicar las probabilidades de cometer esos errores:
α = probabilidad de cometer un error tipo I (nivel de significación)

β = probabilidad de cometer un error tipo II
P(eI ) = P( rechazar H0 / H0 cierta) = α
P(eII ) = P( no rechazar H0 / H0 es falsa ) = β
α y β son probabilidades de errores, son los riesgos asociados con la prueba.
8.5 CONSTRUCCIÓN DE LA REGLA DE DECISIÓN
Ahora sí consideremos el
Paso final para construir la regla o criterio de decisión:
Puede operarse de dos maneras:
⇒ establecer el nivel de significación de la prueba (α) y calcular el valor crítico a partir del
cual se concluye el rechazo de H0, o
⇒ calcular el “valor p” y concluir el rechazo de H0, para valores muy bajos de p, menores
que el nivel de significación α.
⇒ Veamos la primer situación:

- Fijar el valor α (nivel de significación de la prueba), implica establecer la máxima probabilidad
de equivocarnos en rechazar H0 cuando en realidad es cierta.
- Luego se encuentra el valor crítico del estadístico ( xc ) para el cual esa probabilidad se
verifica y se divide el rango de los valores posibles de promedios muestrales en aquellos que
llevarán al rechazo de H0 y aquellos a partir de los cuales no se rechaza que H0 sea cierta.
♦ La P ( eI ) cuando la prueba es unilateral de cola izquierda es:
P ( eI ) = P ( X < x c ) = α
Bajo esta regla de decisión:

Si x obs. > xc no se rechaza H0
Si x obs. < xc se rechaza H0
168
♦ La P ( eI ) cuando la prueba es unilateral de cola derecha es:
P ( eI ) = P ( X > xc ) = α
Bajo esta regla de decisión:

Si x obs. < xc no se rechaza H0
Si x obs. > xc se rechaza H0
Volviendo a nuestro ejemplo, supongamos que el gerente del servicio, después de aplicados
los cambios, quiere decidir sobre las hipótesis planteadas y para ello va a cronometrar
aleatoriamente 30 tiempos de servicio (una muestra aleatoria), fijando un nivel de significación
α = 0,05 (es decir especifica la máxima probabilidad permisible de cometer un error de tipo I) 4.
Busquemos para esta probabilidad de error que se está dispuesto a correr, el valor xc para el
cual esa probabilidad se verifica:
valor de xc tal que: P ( eI ) = P ( X < xc ) = α = 0,05 →
x c − 12,5
El xc es equivalente a zc = 1,2 = -1,65
30
despejando x c = 12,5 − 1,65 * 1,2 = 12,14

30
El valor 12,14 divide a la distribución muestral del estadístico de prueba en dos regiones, una
región de rechazo o región crítica y una región de no rechazo, como se observa en la figura
siguiente:
La regla de decisión que asumimos para el ejemplo es la siguiente:
Si x obs. > 12,14 ( xc ) no se rechaza H0

Si x obs. < 12,14 ( xc ) se rechaza H0
4
Los valores usuales que se eligen para α son 0,05 o valores menores, siendo frecuente el valor 0,01. La opción de
elegir cierto nivel de riesgo de cometer un error tipo I depende del costo de cometer dicho error en el contexto del
problema.
169
En general, para una prueba de hipótesis unilateral, el valor crítico se obtiene:
♦ Prueba de cola izquierda x c = µ 0 − zc ⋅ σ

n
♦ Prueba de cola derecha x c = µ0 + zc ⋅ σ

n
Supongamos ahora que a partir de la muestra aleatoria extraída de 30 tiempos de servicio se

obtuvo un promedio de atención de 12,29 minutos ( x obs. ) ¿Qué decisión debería tomarse?
Decisión como 12,29 > 12,14 ( xc ) no se rechaza H0
Gráficamente:
¿Y el error de tipo 2?
- Supongamos que se quiere evaluar la probabilidad de no rechazar la hipótesis nula cuando el

promedio de la variable ha disminuido a 12,2 minutos. Aquí, lo que se quiere ver es cuál es el
riesgo que se corre con esta regla de decisión de cometer un error de tipo II, si el verdadero
valor de µ fuera 12,2.
Luego: P ( eII ) = P ( X > xc / µa = 12,2 ) = β(12,2)
= P ( X > 12,14 / µa = 12,2 ) = 1 - P ( X < 12,14 / µa = 12,2) =

12,14 − 12,2
= 1 - P (Z < ) = 1 – P ( Z < - 0,27) = 0,6064
1,2 30
170
Observemos que con este criterio de decisión el riesgo que se corre de no rechazar H0 si el
verdadero valor de µ fuera 12,2 es muy alto.
Si repitiéramos la experiencia de seleccionar una muestra de 30 tiempos de servicio cuando el
tiempo promedio de atención en la población fuera de 12,2, el 60% de las muestras no
detectará la disminución del promedio de 12,5 a 12,2. Una probabilidad alta de un error de tipo
II para una determinada alternativa, significa que la prueba no es suficientemente sensible para
detectar la alternativa.
- Veamos ahora cuál es la probabilidad de error de tipo 2, si el verdadero valor de µ fuera 12

minutos:
P ( eII ) = P ( X > x c / µa = 12 ) = β(12)
= P ( X > 12,14 / µa = 12 ) = 1 - P ( X < 12,14 / µa = 12 ) =

12,14 − 12
= 1 - P (Z < ) = 1 – P ( Z < 0,64) = 1 - 0,7389 = 0,26
1,2 30
171
Comparando las dos situaciones anteriores vemos que al situarnos en un valor de µ más
alejado del supuesto en la hipótesis nula, el error de tipo II es más pequeño.
Es evidente que es muy deseable minimizar ambas probabilidades de decisiones incorrectas,
es decir, P(eI) y P(eII) . Observaremos que ambas están relacionadas, ya que para dos valores
posibles de µ (el de la H0 y otro que se corresponda con la Ha), disminuir una lleva al aumento
de la otra, salvo en el caso de un aumento en el tamaño de la muestra, lo que en la práctica, no
es siempre posible.
El aumento del tamaño de la muestra incrementa la potencia del test (reduce la probabilidad
del error de tipo II) cuando el nivel de significación se mantiene fijo.
Si al diseñar un test se fijan los errores I y II que se quieren cometer, el tamaño de muestra
queda determinado por ellos.
Apoyándonos en el ejemplo, supongamos que se quiera trabajar con un nivel de significación
α=0,05 y con una probabilidad de error II β = 0,1 cuando µ es 12,2, ¿con qué tamaño de
muestra se debería trabajar?
8.6 CÁLCULO DEL TAMAÑO DE MUESTRA
La fórmula para su cálculo es la siguiente5:
( zα + z β )2 σ 2
n=
( µa − µ 0 ) 2
5
Esta fórmula se deduce al resolver el siguiente sistema de ecuaciones:
⎧ P (e I ) = α
⎨
⎩ P (e II µ = µ a ) = β
172
(1,65 + 1,28) 2 1,2 2

Luego, para la situación planteada: n= = 137,36 ⇒ n ≥ 138
(12,2 − 12,5) 2
Observamos que para disminuir la probabilidad de error II (β) a 0,1 se necesitan 108
observaciones más en la muestra.
8.7 ENFOQUE DEL VALOR P PARA LAS PRUEBAS DE HIPÓTESIS

⇒ Consideremos ahora el segundo enfoque para decidir: calcular el “valor p” y concluir el
rechazo de H0, para valores muy bajos de p, menores que el nivel de significación α.
¿A que se llama “valor p”?
El “valor p” es la probabilidad de obtener un valor del estimador igual o más extremo que el
resultado obtenido a partir de los datos muestrales, bajo el supuesto de que la hipótesis nula es
en realidad cierta. En otras palabras podemos decir que el “valor p” es la probabilidad de que
un resultado se encuentre al menos tan alejado de µ0, como el valor observado, en dirección a
la hipótesis alternativa.
Cuanto menor es esta probabilidad, más fuerte será la evidencia en contra de la hipótesis nula.
Si en cambio este valor no es tan pequeño, indicará que este resultado no es tan poco
probable si la hipótesis nula es cierta, y entonces diremos que la evidencia muestral no es
concluyente para decidir el rechazo de la hipótesis supuesta como cierta.
Los valores p pequeños constituyen una evidencia en contra de H0, ya que indican que el valor
observado es poco probable de ocurrir sólo por azar, sin embargo los valores más grandes de
p no constituyen ninguna evidencia en contra de H0.
Un valor p menor que el α fijado se considera estadísticamente significativo. Es sólo una
manera de decir que difícilmente se produciría un resultado tan extremo, sólo por azar.
Volviendo al ejemplo de los tiempos de atención, el x obs . fue de 12,29 minutos. Luego el “valor
p” para esta situación resulta:
Valor P = P ( X < x obs. ) = P ( X < 12,29) = P (Z< z obs. ) =

12,29 − 12,5
= P (Z< ) = P (Z< -0,96) = 0,1685
1,2
30
Como el valor p resulta mayor al nivel de significancia asumido 0,05, luego no se rechaza la H0.
Gráficamente:
173

1.- Con referencia al ejercicio Nº 5 del Apunte 6 “Distribuciones Muestrales” la construcción de
los 800 km arrojó una ganancia inferior a los 300 millones de pesos por lo que el contratista
sospecha que ha habido una disminución en la esperanza matemática del espesor. Los
espesores de 1.440 observaciones obtenidas de esta carretera fueron los siguientes:
CANTIDAD DE
ESPESOR
OBSERVACIONES
100 ≤ x < 110 37

110 ≤ x < 120 70
120 ≤ x < 130 128
130 ≤ x < 140 300
140 ≤ x < 150 470
150 ≤ x < 160 265
160 ≤ x < 170 117
170 ≤ x < 180 53
Total 1.440
a) Formule la hipótesis nula y alternativa para determinar si el espesor promedio ha

disminuido.
b) Explique, en este contexto, cuándo se cometería un error de tipo I y cuándo uno de tipo
II.
c) ¿Qué puede concluir con respecto a la sospecha del contratista? (Considere un nivel de
significación α = 0,05 y que el desvío estándar de la variable no se ha modificado)
d) ¿Cuál sería su decisión si considera el valor p de la prueba?
e) ¿Cómo podría llegarse a la misma conclusión que en el punto c) a través de un intervalo
de confianza? ¿Cuál es la información adicional que proporciona el mismo?
2.- Una fábrica produce llantas cuya vida útil es una variable aleatoria distribuída normalmente
con un promedio de 60.000 km y una desviación estándar de 1.900 km.
Un ingeniero de diseño sospecha que la introducción de un nuevo compuesto de caucho
incrementa la vida útil de las llantas produciendo un desplazamiento de la distribución sin
modificar la dispersión de la misma.
A tal fin, se prueban 16 llantas fabricadas con el nuevo compuesto de caucho hasta
alcanzar el fin de la vida útil de las mismas.
Los datos obtenidos, en km, resultaron:
60.613 59.836 59.554 60.252

59.784 61.221 60.311 55.040
60.545 60.257 60.000 59.997
64.947 60.135 60.220 60.523
a) Formule la hipótesis nula y alternativa para determinar si la vida útil promedio se ha

incrementado
174
b) Explique, en este contexto, cuándo se cometería un error de tipo I y cuándo uno de tipo
II.
c) ¿Qué puede concluir respecto de la sospecha del ingeniero de diseño? (Considere un
nivel de significación α = 0,05 y que el desvío estándar de la variable no se ha
modificado)
d) ¿Cuál sería su decisión si considera el valor p de la prueba?
e) Calcule la probabilidad de no rechazar la hipótesis nula cuando el promedio de la
variable ha aumentado a 61000 km.
f) ¿Cuántas observaciones adicionales son necesarias si se quiere reducir la probabilidad
del punto e) a 0,10?
g) ¿Cómo podría llegarse a la misma conclusión que en el punto c) a través de un intervalo
de confianza? ¿Cuál es la información adicional que proporciona el mismo?
3.- Una compañía decide verificar el peso de los rollos grandes de papel de aluminio que
produce una de sus plantas. Los rollos deben tener un peso promedio de 600 kg pero los
costos crecientes de la materia prima han llevado a la administración a sospechar que este
promedio ha aumentado.
Estudios preliminares indican que la desviación estándar de los pesos de los rollos es de 5,8
kg.
La administración decide llevar a cabo una prueba en base al peso de 250 rollos elegidos al
azar. Desea correr un riesgo de a lo sumo 5% de concluir que el peso promedio ha
aumentado cuando en realidad no es así.
a) Plantee la hipótesis nula y la alternativa.
b) Establezca la regla de decisión.
c) Explique en este contexto cuando se cometería un error de tipo II y calcule la probabilidad
de cometerlo cuando µ = 602 kg.
d) Después de revisar la situación de riesgo junto con el costo que supone pesar en forma
individual 250 rollos, la administración decide que han previsto en la prueba una precisión
mayor de la que están dispuestos a pagar. Después de meditar cuidadosamente, deciden
determinar el tamaño de muestra necesario para continuar con la probabilidad de error de
tipo I plantea anteriormente pero con una probabilidad de 0,96 de detectar un aumento
en el peso promedio a 602 kg. ¿Cuántos rollos deberán seleccionarse?

GHK

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

GHK

Caricato da

Copyright:

Formati disponibili

1.

1.2 EJEMPLO DE INTRODUCCION ......................................................... 5

1.3 LENGUAJE DE LA ESTADISTICA ...................................................... 6

1.4. MUESTRA ................................................................................................ 7

1.5 RECOLECCION DE DATOS .................................................................. 9

1.1 PROPOSITO DE LA ESTADISTICA

El análisis estadístico nos provee un conjunto de principios y procedimientos para

El tratamiento estadístico de los datos requiere el empleo de computadoras. Este material de

1.1.1 SITUACIONES DE APLICACION

• Los ingenieros de control de calidad recopilan datos sobre la fiabilidad de partes y

Para lo cual se debe

ANALIZAR EL COMPORTAMIENTO DE UNA O VARIAS CARACTERISTICAS

1.1.2 TRABAJO DE APLICACION

NOMBRE Y APELLIDO : ………………………………………………….

SEXO : …………… EDAD : ………… AÑO DE INGRESO A LA UTN : .................

1.- Marque con una cruz en el casillero correspondiente :

MATERIA APROBADA REGULAR CURSADA SIN CURSAR CURSANDO

2.- Número de materias aprobadas ......................

3.- ¿Es recursante en Probabilidad y Estadística? No Si

¿A qué lo atribuye? …………………………………………………………………....

4.- ¿Es recursante en otra Asignatura? No Si

¿Cuántas horas por día? ………………………………………………………………

1.2 EJEMPLO DE INTRODUCCION

1.2 LENGUAJE DE LA ESTADISTICA

¾ Población: es el grupo total de objetos (elementos, personas, registros, instituciones,

¾ Variable: es la característica de interés que interesa observar en la población en relación al

¾ Parámetro: es una medida que resume información de una característica o variable. Se

¾ Muestra: es una parte de la población que se usa como información.

¾ Inferencia estadística: es el proceso de extraer conclusiones sobre la población

 Complete en el ejemplo de introducción:

Muy frecuentemente es necesario seleccionar una muestra de unidades de la población, para

Una muestra aleatoria simple se obtiene cuando se seleccionan n elementos de una

1.4.1 ¿POR QUE SE TOMAN MUESTRAS?

1.4.2. ERRORES DE LAS MUESTRAS

1.5 RECOLECCION DE DATOS

NOMBRE Y APELLIDO : …………………………………… ….. LEGAJO : …………………

SEXO : ………… EDAD : …………… AÑO DE INGRESO A UTN ..........................

Marque con una cruz en el casillero correspondiente:

2.- Número de materias aprobadas ......................

3.- ¿Es recursante en Probabilidad y Estadística? No Si

¿A qué lo atribuye? …………………………………………………………………....

4.- ¿Es recursante en otra Asignatura? No Si

¿Cuál o cuáles? ………………………………………………………………………………….

¿Cuántas horas por día? ………………………………………………………………

2.2 MEDIDAS CARACTERISTICAS DE UNA DISTRIBUCION DE

2.3 REGLA EMPIRICA 33

2.4 DIAGRAMAS DE CAJA O BOX - PLOT 34

2.5 TRANSFORMACIONES LINEALES 36

2.6 TRABAJO PRACTICO 38

2.7 COMPLEMENTO PARA EL USO DE EXCEL 44

• la presentación de los mismos en forma ordenada ( tablas y gráficos)

2.1 DISTRIBUCIONES DE FRECUENCIAS Y GRAFICOS

Una forma útil de presentar un conjunto de datos es la distribución de frecuencias.

2.1.1 DATOS CORRESPONDIENTES A UN ATRIBUTO

Número de alumnos Proporción de alumnos

Característica en estudio: Condición en Matemática Discreta (variable cualitativa o atributo)

Para armar la distribución de frecuencias se particionó al conjunto de los 499 alumnos

 GRAFICO CIRCULAR O SECTORES (realizado en Excel, con asistente de gráfico )

Condición en Matemática Discreta de los alumnos

 GRAFICO DE BARRAS (realizado en Excel con asistente de gráfico)

Condición en Matemática Discreta de los alumnos

Razón de la falla Frecuencia

Este resultado se presenta en un diagrama de Pareto (obtenido a través del software

Complete en el ejemplo de introducción: