Estadística Aplicada

r
Universidad Tecnológica Nacional

Facultad Regional Buenos Aires
MAESTRÍA EN
INGENIERÍA EN CALIDAD
2006
PROBABILIDAD
Y ESTADÍSTICA
APLICADA
Docentes:
Lic. Fernando Kornblit ferk@inti.gov.ar
Ing. Gustavo Vázquez ogustavovazquez@yahoo.com.ar
UTN – FRBA - Maestría en Ingeniería en Calidad - 2006 Probabilidad y Estadística Aplicada
PROBABILIDAD Y ESTADÍSTICA APLICADA
Motivación y Objetivos generales del módulo
El objetivo central de este curso es presentar los elementos estadísticos básicos

que serán luego utilizados en distintas aplicaciones en Calidad. Cualquier actividad
relacionada con la Calidad requiere la utilización de datos numéricos repetidos. La
Estadística aporta técnicas para analizar estos datos.
Cada vez son más las decisiones que diariamente deben tomarse en las empresas, a
diferentes niveles y, paralelamente, cada vez es mayor la exigencia de que esas
decisiones sean correctas. En consecuencia, los responsables deben estar dotados de
las herramientas adecuadas capaces de asistirlos en la toma de esas decisiones.
Desestimar su uso significa otorgar ventajas considerables.
En este contexto, existen diversas herramientas y métodos estadísticos que ocupan un

papel central. El papel de la Estadística en la calidad industrial ha aumentado y se ha
generalizado rápidamente, extendiéndose su aplicación, desde situaciones meramente
técnicas, como el control de calidad, hasta otras situaciones de la empresa, incluyendo
las vinculadas a la gestión. Algunas de estas situaciones pueden ser: la medición de
la satisfacción del cliente, la evaluación de proveedores y materias primas, la
aplicación de criterios racionales en la formulación de un producto, el control de los
procesos, etc.
Objetivos particulares
Para mayor aclaración, a continuación especificamos con más detalle los

objetivos generales presentados arriba
 Presentar las bases estadísticas de las principales herramientas usadas en la

Calidad.
 Dotar a los participantes de la formación necesaria para el empleo correcto

de estas herramientas, las cuales serán desarrolladas, algunas en este
mismo módulo, y muchas otras en módulos posteriores de aplicación, como
Confiabilidad, Control Estadístico de Procesos y Diseño de Experimentos
 Concebimos que las citadas herramientas deben poder ser aplicadas no

siempre de la misma forma, sino atendiendo a las particularidades concretas
Autor: F. Kornblit 2 / 86
de cada empresa, de cada proceso o producto, y de cada situación. Por lo

tanto en necesario que los participantes reciban no sólo el conocimiento de
las diferentes técnicas o herramientas, sino también la aptitud para
adaptarlas. Para esto, se requiere el aprendizaje e incorporación de criterios
y conceptos teóricos esenciales de Estadística y Probabilidad.
 Para la correcta y fluida incorporación de dichos conceptos, recurriremos a

una nutrida ejemplificación y ejercitación, la cual será comentada con los
docentes
Diferencia con otros cursos de Estadística y Probabilidad
La aplicación de una herramienta estadística a situaciones reales comprende por lo

general tres tareas progresivas:
a) elegir la técnica o herramienta adecuada para cada

aplicación,
b) aplicarla eficientemente, teniendo en cuenta las
particularidades que la situación requiere
c) interpretar correctamente los resultados;
Sin embargo, es de notar que, por lo general, la bibliografía y los cursos de

capacitación aluden casi exclusivamente a la segunda de ellas, dejando de lado el
abordaje global del problema, sin el cual no es posible sacar provecho de la técnicas
empleadas, ni asegurar que las decisiones consecuentes sean las adecuadas.
Intentaremos siempre mostrar este abordaje global.
La mayoría de las carreras universitarias, no solamente las carreras técnicas

(ingenierías, licenciaturas en ciencias, bioquímica, informática, ciencias sociales, etc)
incluyen en sus currículas algún curso de Probabilidades y Estadística. Probablemente
muchos de los alumnos de esta carrera virtual hayan cursado alguno de estos cursos.
La enseñanza de la Estadística en los estudios de grado suele tener una modalidad
teórica, no siempre vinculada a la resolución de los problemas concretos.
A diferencia de ellos, este no es un curso teórico o “académico”. El título de este

módulo es “Probabilidad y Estadística Aplicada”, y señalamos particularmente la última
palabra. Este curso pretende abarcar los diferentes temas desde el punto de vista de
su aplicación en la calidad.
Nos proponemos, en este módulo, recuperar aquellos temas y técnicas estudiados,
en el contexto de las aplicaciones citadas más arriba. De esta manera, a la vez que
se aprovecha y justifica la formación previa, se le da un sentido diferente,
otorgándole al alumno elementos que suponen una ventaja competitiva en sus

actividades profesionales.
Trabajaremos, siempre que sea posible, con casos y ejemplos tomados de la

experiencia industrial o de servicios, y será útil complementar los contenidos y
ejemplos brindados por los docentes con casos provenientes de la experiencia laboral
de los alumnos, tanto en comunicaciones por e-mail como en las sesiones de chat.
Metodología a utilizarse en el módulo
La metodología de enseñanza de este curso debe ser acorde a los objetivos

expuestos más arriba. Se trabajará con la modalidad de curso-taller. En este marco,
entendemos como muy importante la ejercitación con datos concretos, tomados
muchos de ellos de la práctica industrial
Se pretende abordar los problemas a partir de la experiencia concreta en el propio

ámbito de trabajo de los asistentes, estimulando su participación. Se trabajará
dentro de lo posible a partir de la exposición y resolución de problemas concretos,
que requieran el uso de herramientas estadísticas. Los alumnos intentarán la
resolución de estas situaciones, en forma individual o grupal, para luego evaluar
globalmente esa solución con los docentes. Se discutirán las posibilidades de
aplicación en cada caso. Los docentes aportarán estas situaciones típicas, a partir
de su propia experiencia en empresas de la alimentación. Sin perjuicio de esto, se
alentará también a que los participantes aporten casos de su propia actividad, para
ser discutidos en clase, intentando la propuesta de soluciones.
Previamente al estudio de estos casos, será necesaria el repaso y/o profundización

de los conceptos estadísticos vistos en las carreras de grado. Se reducirá, en lo
posible, la complejidad matemática asociada a estos conceptos. Se ejercitarán los
distintos temas, y habrá, a lo largo del módulo, preguntas y ejercicios para ser
respondidos por el alumno
USO DEL EXCEL: El Excel será utilizado en este módulo para ejemplificar los
temas y realizar ejercicios. En el marco de la metodología desarrollada más arriba,
entendemos como muy importante la ejercitación con datos concretos, tomados
muchos de ellos de la práctica industrial. La elección de esta herramienta se
fundamenta en el hecho de ser el programa de manejo de datos y cálculos más
conocido y utilizado. Además, contiene las funciones y herramientas estadísticas
necesarias para este módulo.
Por lo tanto, se recomienda fuertemente que los alumnos tengan conocimientos
mínimos del uso de Excel (versión 95 o posterior). Muchos de los ejercicios que
plantearemos para su resolución están pensados para ser resueltos en ese
programa. La recomendación de conocimientos mínimos de Excel significa sólo eso:

conocimientos mínimos: saber cargar datos en una hoja de cálculo, copiar y pegar
celdas, y, eventualmente, estar en condiciones de hacer un gráfico, con el asistente
de gráficos, (este ícono: ) y no mucho más que eso. De ninguna manera se
requiere tener un nivel de experto. Durante el módulo, iremos explicando la
utilización de algunas funciones y herramientas estadísticas particulares
TRABAJOS PRÁCTICOS: Junto con este material se presenta un archivo Excel con
5 ejercicios de Trabajos Prácticos cuya resolución grupal es obligatoria. Cada uno
de estos ejercicios corresponde a un problema práctico en empresas ficticias. Para
la resolución de los mismos se requiere la aplicación de algunas de las
herramientas estadísticas vistas durante el curso. La solución hallada por el grupo
deberá elaborarse de forma tal que simule ser un informe para la empresa en
cuestión (realizado por un grupo de la misma empresa, o por consultores externos,
etc). Estos informes deberán contener, al menos, los siguientes 4 puntos:
a) Introducción. Planteo del problema, aspectos a estudiar o mejorar, riesgos

involucrados, etc
b) Abordaje del problema. Herramientas utilizadas. Breve desarrollo de la
metodología empleada. No es necesario copiar las fórmulas matemáticas
que se utilicen, sino sólo el nombre de las herramientas. Se sugiere la
utilización de la computadora.
c) Resultados obtenidos luego de realizar los cálculos estadísticos.
Resultados numéricos, tablas, gráficos, deducciones estadísticas que
correspondan.
d) Conclusiones o decisiones sugeridas, a partir de los resultados. Deben
ser redactadas teniendo en cuenta que serán enviadas a personas de la
dirección de la empresa sin conocimiento de Estadística. Este último
punto puede entenderse como la “traducción” del punto c), a un lenguaje
no estadístico
EJERCICIOS A RESOLVER: En el Apéndice IV se presenta una lista de ejercicios,

cuya resolución por los alumnos es altamente recomendada. Los ejercicios del
examen final serán similares a éstos.
CONDICIONES DE APROBACIÓN: Para aprobar el módulo, los alumnos deberán

tener los trabajos prácticos aprobados (en forma grupal) y, por otro lado, aprobar el
examen final, individual que será tomado la última clase.
CAP: I. INTRODUCCIÓN Y ESTADÍSTICA DESCRIPTIVA
Parte 1. LAS 10 PREGUNTAS INICIALES

A continuación, para introducir este módulo vamos a formular algunas preguntas
que pensamos se estarán haciendo ustedes en este momento, y a responderlas
1.¿Por qué estudiar Estadística Aplicada en un curso de posgrado en Calidad?

2.¿Cuáles son las aplicaciones principales?
3.¿Cuál fue, brevemente, la historia de los métodos estadísticos en Calidad?
4. ¿Qué es la Estadística?
5. ¿Cuáles son los Objetivos de la Estadística?
6. ¿Cómo se aplican las técnicas estadísticas?
7.Qué desventaja y que ventaja, en general, tiene la aplicación de una herramienta
estadística?
8. ¿Cuál es el papel de los datos y de qué tipo son?
9.¿Qué diferencia el contenido de este módulo del de un curso de Estadística de
una carrera de grado?
10.¿Dónde aparece la variabilidad y cómo se relacional con los objetivos de estudio
planteados?
1.¿Por qué estudiar Estadística Aplicada en un curso de posgrado en Calidad?

Podríamos dar muchas respuestas a esta pregunta, pero preferimos dejar que la
norma ISO 9000 responda por nosotros. En el punto 2.10. de ISO 9000.1:2000,
Papel de las técnicas estadísticas, se hace una referencia general a la aplicación
de la Estadística en la Calidad:
“El uso de las técnicas estadísticas puede ser de ayuda para

comprender la variabilidad y ayudar por lo tanto a las organizaciones a
resolver problemas y a mejorar la eficiencia y la eficacia. Asimismo
estas técnicas facilitan una mayor utilización de los datos disponibles para
ayudar en la toma de decisiones
La variabilidad puede observarse en el comportamiento y en los

resultados de muchas actividades, incluso bajo condiciones de
aparente estabilidad. Dicha variabilidad puede observarse en las
características medibles de muchos procesos, y su existencia puede
detectarse en las diferentes etapas del ciclo de vida de los productos,
desde la investigación de mercado hasta el servicio al cliente y su
disposición final.
Las técnicas estadísticas pueden ayudar a medir, describir,

analizar, interpretar y hacer modelos de dicha variabilidad, incluso con
una cantidad relativamente limitada de datos. El análisis estadístico de
dichos datos puede ayudar a proporcionar un mayor entendimiento de la

naturaleza, alcance y causas de la variabilidad, ayudando así a resolver e
incluso prevenir los problemas que podrían derivarse de dicha
variabilidad, y a promover la mejora continua.
En el informe estadístico ISO/TR 10017 se proporcionan orientaciones

sobre las técnicas estadísticas en los sistemas de gestión de la calidad ”
El citado documento,ISO/TR 10017:1999(E) Guidance on statistical techniques for

ISO 9001:1994, contiene una rápida referencia de las principales técnicas y
herramientas estadísticas para la gestión de la calidad, enfocada según los criterios
de la versión 1994 de la familia de normas, incluyendo las referencias cruzadas
entre los distintos requisitos y dichas técnicas. El mismo debiera ser completado
agregando elementos necesarios para la satisfacción de requisitos adicionales que
aparecen en la versión 2000, tales como herramientas para medir de la satisfacción
del cliente o para la mejora continua.
DEBATE:
Preguntas para el debate:
1¿Qué entiende por “eficiencia” y “eficacia”?
2 Dar ejemplo de “características medibles” de los procesos de la empresa
en que used trabaja o que usted conoce
3 dar ejemplos de “variabilidad de procesos”, tanto para procesos
productivos como de gestión
2.¿Cuáles son las aplicaciones principales?
“Sólo lo que puede medirse puede mejorarse” es una de las primeras

afirmaciones que debe tener en cuenta quien se introduce en el mundo
de la Calidad. A tal fin, la Estadística puede utilizarse para establecer
objetivos, proponer indicadores y evaluar el grado de cumplimiento de los
mismos.
Las siguientes son algunas de las principales aplicaciones de la Estadística en la
Calidad. Todas ellas serán estudiadas en detalle en el transcurso de los diferentes
módulos de esta carrera virtual. En este módulo, veremos algunas de estas
aplicaciones, pero, al mismo tiempo daremos las bases estadísticas y probabilísticas
para que sea posible, posteriormente, encarar los sucesivos módulos estadísticos.
a) Estadística Descriptiva: Técnicas para describir, sintetizar y presentar datos

cuantitativos de la forma adecuada para comprenderlos y analizarlos. Muchas
veces, los análisis descriptivos constituyen el primer paso de un estudio más global.
En este módulo veremos las herramientas más comunes
b) Inferencia Estadística: En este módulo veremos los conceptos principales. Inferir

significa obtener información sobre una población bajo estudio, a partir de datos
observados sobre una muestra extraída de aquélla. Esta información, por lo
general, lleva implícita la toma de alguna decisión, tanto a nivel gerencial como
operativo. La inferencia puede consistir en la estimación de algún parámetro de
la población –puntualmente o por un intervalo de confianza- , o en la aceptación
o rechazo de alguna hipótesis sobre la población –tests de hipótesis.
c) Ensayos de aceptación por muestreo: El término muestreo significa métodos

estadísticos sistemáticos para obtener información sobre la población, a
partir de la inspección de muestras relativamente pequeñas. El uso de
estos métodos para decidir la aceptación o rechazo de lotes entregados
por proveedores internos o externos, o bien de productos finales, ha sido
históricamente la primera aplicación de la estadística al Control de
Calidad, y aún hoy siguen siendo utilizados en el marco de sistemas más
modernos de gestión.
d) Control Estadístico de Procesos: En el módulo del mismo nombre se

estudiarán la herramientas asociada a los gráficos de control, herramienta muy útil y
extendida. El Control Estadístico de Procesos (CEP, o SPC, en idioma inglés) es, un
conjunto de técnicas que tienen como objetivo controlar la variabilidad y estabilidad
de los procesos, y detectar las posibles desviaciones de los mismos, con el fin de su
rápida corrección, antes de que se produzcan unidades defectuosas. En general
resulta muy tarde controlar un producto después de su completa fabricación. Es
preferible controlar el proceso de fabricación, del producto o de sus componentes.
Serán los mismos responsables de la producción, quienes controlen al mismo tiempo
la calidad de la misma. De esta manera, se puede reducir o hasta eliminar la
inspección final del producto.
Los estudios de capacidad de procesos permiten, a su vez, evaluar
estadísticamente el cumplimiento de la especificaciones.
e) Confiabilidad: Es la aplicación de métodos estadísticos e ingenieriles para

evaluar la performance de productos a lo largo de su tempo de uso, y
predecir por lo tanto su vida útil. Los estudios de confiabilidad son
necesarios en diferentes etapas de la vida del producto, como por ejemplo
el diseño. En el módulo del mismo nombre serán estudiados estos
métodos.
f) Análisis de mediciones: (““Análisis del Sistema de Medición” en el contexto de la

industria automotriz).Comprende una serie de procedimientos estadísticos
para asegurar la exactitud de las mediciones que puedan afectar a la
calidad de los productos o procesos, teniendo en cuenta la variabilidad en
las condiciones en que se realizan esas mediciones. Es necesario conocer
la incertidumbre de las mediciones y asegurar que la misma es compatible
con la capacidad de medición requerida. En el módulo “Metrología” se
estudiarán estos temas.
g) Diseño de experimentos: estudios llevados a cabo para evaluar, con cierto nivel
de confianza, características de productos, procesos o sistemas, a partir del
conocimiento de la respuesta de los mismos ante la variación planificada de algunas
de sus magnitudes de influencia. En el módulo Diseño de Experimentos
Tecnológicos se verán con detalles estas metodologías
3.¿Cómo fue, brevemente, la historia de los métodos estadísticos en Calidad?

Primeramente, la Estadística se utilizaba en aplicaciones de Control de Calidad,
inspeccionando productos terminados o semielaborados de producción masiva Las
primeras técnicas utilizadas estaban relacionadas con ensayo de productos por
muestreo y descarte de no conformes; esto es, se procedía al control del proceso
después de su fabricación (ver c), en la pregunta anterior.). Surgieron as, distintos
criterios y procedimiento para muestreo e inspección, basados en modelos
estadísticos.
Prontamente, estos métodos comenzaron a volverse excesivamente costosos y poco

prácticos, porque impedían la corrección de fallas durante los procesos productivos.
En la década de 1920 en U.S.A. con los trabajos de Shewhart, de los Laboratorios
Telefónicos Bell surge la idea de controlar el proceso, durante la fabricación. Los
métodos del CEP (ver d) en la pregunta anterior) son difundidos durante la posguerra,
en Japón por Deming (discípulo de Shewhart) e Ishikawa, y son muy bien aceptados.
A partir de acá las herramientas estadísticas comienzan a tener un rol activo en el
aseguramiento y gestión de la calidad. Recién en la década del 70 los métodos del
CEP son generalizados en Occidente. Hoy día, los métodos más aceptados de gestión
de la Calidad, como TQM, o 6 sigma, reconocen como centrales a las herramientas
estadísticas. Algunos de los principios de gestión de la ISO 9000:2000, como el de la
mejora continua, el de la gestión por procesos, o el del enfoque al cliente llevan
implícitos la utilización de técnicas estadísticas.
En síntesis, podemos decir que la aplicación de la Estadística en la Calidad,

evolucionó, durante todo el siglo XX, en la misma dirección que la Calidad misma:
desde aplicaciones puramente técnicas y separadas de los procesos productivos,
hacia la inclusión en actividades de gestión, con un enfoque más totalizador.
4. ¿Qué es la Estadística?
Antes de ver la respuesta a esta pregunta, intente

escribirla: ....................................................................................................
......................................................................................................................
..................
......................................................................................................................
.
La Estadística provee un conjunto de técnicas que permiten recolectar, procesar,
describir, sintetizar o visualizar datos numéricos, y obtener información a partir de
los mismos, con el propósito de tomar decisiones útiles. Estos datos son por lo
general recogidos por observación o medición, a partir de un universo sometido a
estudio o inspección.
Ese universo objeto de estudio es llamado población. Por ejemplo, si una fábrica de
pantalones desea estudiar la cantidad de defectos superficiales de la tela en la
producción de un mes, la población está formada por todos los pantalones producidos
ese mes. Si se desea saber con qué frecuencia un horno supera una dada
temperatura admisible, la población a todas las posibles operaciones posibles del
horno. Si se quiere estudiar el grado de satisfacción de nuestros clientes con alguno
de nuestros productos, la población abarca la totalidad de nuestros clientes (reales o
potenciales)
En general resulta imposible o impracticable la inspección de todos los elementos de

una población. Una muestra es un subconjunto de elementos tomados de la
población. En los ejemplos anteriores, una muestra está formada por los 80
pantalones que serán inspeccionados buscando defectos, o por 30 repeticiones del
proceso de horneado en las que se medirá la temperatura máxima, o por 200 clientes
que serán sometidos a una encuesta. Al número de elementos de la muestra se lo
llama tamaño de la misma. Notaremos x1,...,xn a una muestra típica, de tamaño n.
Se busca que la muestra sea lo más representativa posible de la población. Si

eligiéramos por ejemplo los 20 primeros pantalones producidos el primer día del mes,
no estaríamos haciendo lo correcto estadísticamente, dado que la muestra obtenida
no registraría cambios en la producción posteriores a su obtención. Se trata de elegir
la muestra al azar entre la población, esto es, de forma tal que cada elemento de la
población tenga igual chance de ser elegido.
5. Objetivos de la Estadística:
Haciendo una gran simplificación, podemos decir que la Estadística persigue alguno
de los dos objetivos siguientes:
1.Expresar resultados numéricos en un contexto tal que se

puedan interpretar y juzgar,
para:
2.Tomar las decisiones correctas, teniendo en cuenta un nivel de
confianza o de riesgo adecuado
El primero de ellos es evidentemente menos ambicioso que el segundo. Basta con

presentar cierta información sobre datos observados o medidos, de alguna forma
conveniente. Llamamos Estadística Descriptiva (ver 2a) a esta disciplina.
Abriendo cualquier periódico podemos ver información estadística descriptiva sobre
distintos temas, en forma de gráficos o tablas por ejemplo. En este caso, en rigor,
no nos preocupamos demasiado por la representatividad de esos datos que se han
descrito, solamente por la forma de describirlos.
El segundo de los objetivos implica un estudio más global que comprende, así como
la evaluación de la representatividad de la muestra observada, el estudio de las
características de la población de la que esa muestra fue extraída, dado que la
decisión que se tomará afectará a la totalidad de la población, no solamente a la
muestra. Llamamos Inferencia Estadística a esta disciplina (ver 2b) Dado que la
aplicación de técnicas de Inferencia Estadística requiere tener conocimientos
previos sobre la población en estudio, se vuelve necesario dominar algunos
elementos de la Teoría de la probabilidad, que serán dados en este módulo a partir
del Capítulo 2.
Fundamentalmente, las aplicaciones de la inferencia pueden clasificarse a dos

casos. En primer lugar tenemos aquellos en que las características de la población
(parámetros, como por ejemplo el valor medio de un proceso, o la proporción de
unidades falladas) son desconocidas y deben ser estimadas a partir de datos de
muestras. Las técnicas de estimación y de intervalos de confianza se incluye en
esta modalidad. Otras aplicaciones aparecen cuando queremos verificar si alguna
suposición asumida sobre la población es cierta o no. En estos casos aplicamos los
llamados tests de hipótesis. De alguna manera, lo que tratamos de hacer acá es
dilucidar cuándo un fenómeno dado puede deberse o no al azar
. Como ejemplo de esto último, supongamos que un fabricante suele comprar
ciertos componentes a un proveedor determinado. Este último afirma que el material
que vende sólo es defectuoso en un 3%; sin embargo, el fabricante no está
dispuesto a aceptar a ciegas su palabra, y quiere verificar tal afirmación, mediante
un plan de muestreo. Selecciona al azar 50 componentes y encuentra, entre ellos, 3
defectuosos (6%). ¿Refuta este hecho la afirmación del proveedor, o no? Esta
pregunta podrá ser contestada al ver Test de hipótesis más adelante.
En este módulo veremos las bases de la Estadística Descriptiva e Inferencial,

pero muchas de los temas que serán vistos en módulos futuros también pueden ser
comprendidos dentro de los esquemas dados acá.
6. ¿Cómo se aplican las técnicas estadísticas?

La aplicación de la Estadística a situaciones reales comprende por lo general tres
tareas sucesivas:
d) elegir la técnica o herramienta adecuada para cada aplicación,

e) aplicarla eficientemente, teniendo en cuenta las particularidades que
la situación requiere
f) interpretar correctamente los resultados;
Sin embargo, es de notar que en general la bibliografía y los cursos de capacitación

aluden casi exclusivamente a la segunda de ellas, dejando de lado el abordaje global
del problema, sin el cual no es posible sacar provecho de la técnicas empleadas, ni
asegurar que las decisiones consecuentes sean las adecuadas. Intentaremos
siempre mostrar este abordaje global.
7. Qué desventaja y que ventaja, en general, tiene la aplicación de una

herramienta estadística?
DESVENTAJA Ningún método estadístico es “100% seguro” No

estamos libres de riesgos!
VENTAJA Estos riesgos pueden ser cuantificados, y los métodos
pueden ser elegidos para que sean razonablemente pequeños
Una respuesta típica de un problema estadística puede ser dada, por ejemplo, “con
un 95% de confianza”, o “con un 99% de confianza”. Al trabajar con datos
aleatorios, hay siempre un nivel de riesgo de que las conclusiones no sean
correctas. Sin embargo, en tren de asegurar confianza al usuario de la herramienta
en cuestión, deberemos elegir la misma con niveles altos de confianza.
8. ¿Cuál es el papel de los datos y de qué tipo son?

Podemos decir que los datos constituyen la “materia prima” de la Estadística. Por
eso es que vale la pena detenerse en clasificar los distintos tipos de
datos que pueden aparecer, de acuerdo al siguiente diagrama.
NOMINALES (pertenencia)
CUALITATIVOS MODELO
ORDINALES (ranking) BINOMIAL
DAT
OS DE ITEMS DEFECTUOSOS
DISCRETOS
(resultados de
conteos) DE DEFECTOS MODELO
DE
CUANTITATIVOS
POISSON
CONTINUOS
(resultados de
mediciones)
MODELO NORMAL
(GAUSSIANO)
1. Datos nominales: Indican pertenencia a grupos o clases. Por ejemplo, si

hacemos una encuesta sobre el equipo de fútbol preferido de los alumnos,
tendríamos como resultados datos nominales (por ejemplo, podríamos tener:
15 alumnos “pertenecientes” a Boca Juniors, 12 “pertenecientes” a River Plate,
8 “pertenecientes” a Racing, etc) Para su análisis estadístico, los datos
nominales pueden ser convertidos en datos cuantitativos
2. Datos ordinales: Datos que representan un orden de preferencias. Si se le
pide a un consumidor que ordene, según sus preferencias, 5 productos
similares de 5 marcas diferentes, tendremos esta situación.
Los datos cualitativos, tanto nominales como ordinales, son útiles en
investigaciones de mercado, y mediciones de satisfacción de los clientes. Sin
embargo, en este curso nos concentraremos en el el tratamiento de los datos
cuantitativos, por entender que su estudio brinda un enfoque más general, y
porque, si se trabaja con muestras reales, los datos cualitativos pueden tratarse
muchas veces con las mismas herramientas, por ejemplo, como datos
cuantitativos discretos.
3. Datos discretos. Datos resultantes de “contar” elementos o eventos. Por
ejemplo, número de unidades falladas en una muestra bajo inspección, o
número de reclamos de clientes, o número de empleados ausentes por día, o
número de entregas de un producto a término. Si bien desde el punto de vista
de su estructura matemática, los datos discretos están representados por
números enteros, podríamos reemplazar en los ejemplo anteriores, “número
de...” por “porcentaje o proporción de...“.con lo cual se pierde la condición
de enteros. Para estudiar las características probabilísticas de los sistemas con
datos discretos, utilizamos dos modelos matemáticos: el de la Distribución
Binomial para casos como aquellos en los cuentan la cantidad de unidades
falladas y el de la Distribución de Poison para casos como aquellos en los
que se cuenta la de cantidad de fallas. Los datos discretos aparecen cada vez
que se hacen controles o inspecciones “por atributos” esto es, detectando la
presencia o ausencia de una falla u otro atributo no numérico.
4. Por último, los datos continuos son aquellos que pueden tomar cualquier valor
numérico, no necesariamente entero. En general, los datos continuos aparecen
como resultados de mediciones (físicas, químicas, biológicas, etc). Por
ejemplo, diámetros de piezas, temperaturas de procesos, concentraciones de
impurezas, caudales de tuberías, etc. Si bien no hay un único modelo
matemático para caracterizar las propiedades probabilísticas de estos
sistemas, el de la Distribución Normal (o Gaussiana) se aplica en la mayoría
de los casos.. Los datos continuos aparecen cada vez que se hacen controles
o inspecciones “por variables” esto es, midiendo características numéricas en
las muestras bajo ensayo
Para el alumno: Intente dar ejemplo de diferentes tipos de datos, en

las siguientes situaciones, en una empresa que conoce o donde
trabaja:
a) Control de los procesos
b) Tratamientos de reclamos
c) Procesos de análisis y mejora
d) Revisión por la dirección
e)Ensayos
9.¿Qué diferencia el contenido de este módulo del de un curso de Estadística de

una carrera de grado?
La mayoría de las carreras universitarias, no solamente las carreras técnicas
(ingenierías, licenciaturas en ciencias, bioquímica, informática, ciencias sociales, etc)
incluyen en sus currículas algún curso de Probabilidades y Estadística. Probablemente
muchos de los alumnos de esta carrera virtual hayan cursado alguno de estos cursos.
La enseñanza de la Estadística en los estudios de grado suele tener una modalidad
teórica, no siempre vinculada a la resolución de los problemas concretos.
A diferencia de ellos, este no es un curso teórico o “académico”. El título de este
módulo es “Probabilidad y Estadística Aplicada”, y señalamos particularmente la
última palabra. Este curso pretende abarcar los diferentes temas desde el punto de
vista de su aplicación en la calidad.
Nos proponemos, en este módulo, recuperar aquellos temas y técnicas estudiados,

en el contexto de las aplicaciones citadas más arriba. De esta manera, a la vez que
se aprovecha y justifica la formación previa, se le da un sentido diferente,
otorgándole al alumno elementos que suponen una ventaja competitiva en sus
actividades profesionales.
Trabajaremos, siempre que sea posible, con casos y ejemplos tomados de la

experiencia industrial o de servicios, y será útil complementar los contenidos y
ejemplos brindados por los docentes con casos provenientes de la experiencia laboral
de los alumnos.
10 ¿Dónde aparece la variabilidad y cómo se relaciona con los objetivos de

estudio planteados?
Podemos decir también que la Estadística provee un estudio sistemático de la
variabilidad. Este concepto de variabilidad, que aparecía en la ISO 9000 (ver
pregunta 1) es central. La variabilidad existe siempre, en todos los procesos, en
todos los sistemas, en todas las situaciones consideradas, y su existencia es lo que
justifica la introducción de técnicas y métodos estadísticos.
En general uno intenta de actuar de forma lo más consistente posible, obteniendo la

menor variación. Una medida de la calidad de un proceso es la baja dispersión
entre sus resultados. Sin embargo, es imposible llegar a una variación nula. Si
consideramos una muestra de 10 productos producidos por un mismo proceso, o de
10 mediciones sobre una misma unidad, los resultados obtenidos no serán ni
exactamente iguales al valor deseado, ni tampoco exactamente iguales entre sí,
por más esfuerzo que pongamos en ello. Por lo tanto, existirá variabilidad.
Una forma clásica de representar las causas de esta variabilidad es a través del
diagrama de Ishikawa o de espina de pescado, en el cual se muestran los
factores más usuales que la generan: Máquinas, Métodos, Mano de Obra,
Mediciones, Medio ambiente, Materiales (las 6 M). A su vez, cada una de estas “M”
puede subdividrse en otras causas de variabilidad, llegando a obtener un “mapa de
la variabilidad de un proceso”
Si la variabilidad del resultado está dentro de los límites esperados, deduciremos

que todos los factores estarán controlados. Pero, por el contrario, si la variabilidad
del resultado no es la esperada, deberemos investigar cuál o cuáles de ellos están
fallando. Para detectar esto, podemos utilizar la técnicas del Diseño de
Experimentos
Otra manera de entender las causas de variabilidad es a través de sus

“distribuciones de proabilidad” Estas son leyes, o modelos matemáticos qué
explican de qué manera varía cada uno de estos factores. Más adelante
hablaremos con detalle de las distribuciones de probabilidad, pero por ahora
podemos introducir gráficamente este concepto en el diagrama de Ishikawa:
II. ESTADÍSTICA DESCRIPTIVA
Distinguimos dos técnicas básicas para describir datos. Por un lado, las técnicas de
cálculo de “estadísticos” o medidas de tendencia, y por otro lado las técnicas
gráficas.
1.Estadísticos: Son valores obtenidos por cálculo, a partir de los datos muestrales,
que sirven para representar las características básicas de la muestra.
1.1.Estadísticos de valor medio o tendencia central. Muchas veces se vuelve

necesario describir a una muestra (conjunto de datos numéricos) de una manera lo
más sintética posible, representándola a partir de uno único valores que "resuma" toda
la información presente en ella. Una medida de valor medio (o tendencia central o
posición) es un estadístico que nos dice la posición central de los valores de la
muestra, respecto de una referencia dada.
1.1.1. Promedio aritmético: La medida de posición más conocida es el promedio o

media muestral
n
x
i 1
i
x=
n
El uso del promedio como medida de localización está justificado en el hecho de que,
al promediar los valores, los "pequeños desvíos" que influyen en cada repetición, se
compensan, anulándose mutuamente. Desde el punto de vista de la teoría estadística,
el promedio tiene muchas propiedades deseables para caracterizar la posición o
tendencia central de una muestra. Debemos prevenir, sin embargo, la posible
presencia de valores anómalos o no consistentes con el resto de la serie (outliers),
pues el promedio es muy sensible ante este tipo de irregularidades. Supongamos por
ejemplo que tenemos 5 valores:
3,21 3,26 3,18 3,55 3,20
El cálculo da 3,28. Si observamos bien los datos, vemos que el cuarto de ellos difiere
de los demás, posiblemente por algún error o accidente grosero al que no podemos
catalogar de "aleatorio". Esto produce una diferencia significativa con el promedio que
se obtendría de los restantes 4 valores, de 3,21. Este ejemplo nos dice que debemos
analizar los datos antes de emplear mecánicamente una técnica estadística.
Cálculo del promedio con datos agrupados: Supongamos que se arrojó 20 veces
un dado, y se obtuvieron los siguientes resultados:
1 2 2 5 6 6 4 3 5 4
1 3 2 1 6 4 4 5 3 1
Calculemos el promedio, ordenándolos de menor a mayor, y haciendo el siguiente

desarrollo matemático:
x=
1+ 2 + 3 + 5 + 6 + 6 + 4 + 3 + 5 + 4 + 1+ 3 + 2 + 1 + 6 + 4 + 4 + 5 + 3 + 1
 =
20
1  4 + 2  2 + 3.4 + 4  4 + 5.3  6.3
= 
20
4 2 4 4 3 3
= 1 +2 +3 +4 + 5  6 =
20 20 20 20 20 20
= 1  fr( 1 ) + 2  fr( 2 ) + 3  fr( 3 ) + 4  fr( 4 ) + 5  fr( 5 )  6  fr( 6 ) 
=  i  fr(i)  3,95
donde fr(1), fr(2), etc representan a las frecuencias relativas de cada resultado, esto
es, la cantidad de veces que ocurrió cada resultado dividida por la cantidad total de
datos:
3 4 número de ocurrencias del resultado i

fr (5)  , fr (6)  ,, fr (i ) 
20 20 n
1.1.2. Mediana. Otra medida de tendencia central es la mediana de una muestra. Para
calcular la mediana se debe ordenar la muestra de menor a mayor; si el tamaño de la
muestra es impar, la mediana es el valor central de la muestra ordenada. Si es par, el
promedio de los dos valores centrales. En el ejemplo anterior ( 3,21 3,26 3,18 3,55
3,20), la mediana es m = 3,21. Eliminando el cuarto valor, la mediana llega a
ser m'=(3,20+3,21)/2 = 3,205 . Se observa en el ejemplo una característica de la
mediana: su poca sensibilidad ante la presencia de valores anómalos. Observemos
que si el cuarto dato, en lugar de 3,55 fuera 1000,55 , la mediana m seguiría siendo
3,21 . Entonces, la ventaja de la mediana respecto de la media es, además de ser más
fácil su cálculo, su alta resistencia a modificaciones groseras en los datos. En cambio,
es un estadístico menos eficiente que la media dado que utiliza menos información de
la muestra (solamente el o los valores centrales). Se utiliza la mediana cuando hay
una gran probabilidad de que en la muestra haya valores anómalos, o cuando los
datos no se distribuyen simétricamente.
Cálculos en Excel:
Para calcular el promedio y la mediana de una muestra usando las
funciones estadísticas del Excel, realice lo siguiente: (Intente con los 5 datos
del ejemplo anterior)
1. Ingrese a la hoja de cálculo los datos los datos cuyo promedio (o mediana)
desea calcular. Éstos ocuparán un rango de celdas (por ejemplo, si ingresa 5
valores y los ubica desde la primera celda de la hoja y hacia abajo, el rango de
celdas será A1:A5). Luego, sitúe el cursor o el mouse en cualquier otra celda.
2.Haga doble click en el Asistente de Funciones, correspondiente al ícono
siguiente:
3. En la ventana izquierda, Categoría de la función busque “Estadísticas” A

continuación, busque en la ventana de la derecha, Nombre de la función, hasta
encontrar las funciones promedio (o mediana). Luego cliquee Aceptar
4. Ingrese el rango de celdas de la hoja de cálculo donde se encuentran los datos
cuyo promedio (o mediana) desea calcular. Puede marcar este rango
“pintándolo” con el mouse en la hoja de cálculo. Luego cliquee en Aceptar
5. El resultado aparecerá en la celda donde se ubicaba el cursor antes de llamar
al asistente de funciones.
6. Una vez que memoriza el nombre de la función (en este caso promedio o
mediana) no necesita llamar al asistente de funciones cada vez. Puede realizar el
cálculo tipeando la función directamente. Por ejemplo:
=promedio(A1:A5) o =mediana(A1;A5)
(El símbolo = le indica al Excel que lo que viene a continuación es una función o
fórmula.)
Ejercicio:
En una empresa mediana trabajan 70 personas. Los siguientes datos muestran el
salario de los empleados, según sus categorías:
40 personas ganan $400
1 persona gana $4000
1 persona gana $5000
Calcular, usando la computadora, el promedio y la mediana de los sueldos del
personal. ¿qué conclusiones puede sacar?
Otro ejemplo: Dos proveedores diferentes suministran una materia prima

entregada en recipientes de 5l. Se han tomado muestras de 10 recipientes de cada
proveedor, analizando químicamente el contenido de impurezas de cada recipiente,
y obteniendo los siguientes valores (por ejemplo, en mg/l)
Proveedor 1 0.15 0.17 0.26 0.29 0.22 0.17 0.18 0.27 0.19 0.21 0.30 0.19 0.21 0.18 0.16
Proveedor 2 0.03 0.11 0.14 0.04 0.07 0.12 0.12 0.09 0.07 0.14 0.03 0.12 0.06 0.12 0.05
Ahora, intente calcular, por medio del Excel, los promedios y medianas para
ambos proveedores (puede copiar directamente la tabla con los datos al Excel)
y verificar que, (redondeando al segundo decimal):
x1  0,21 med1  0,19
x1  0,09 med1  0,09
Es evidente que, tanto el promedio como la mediana permiten caracterizar la
diferencia entre ambos proveedores. Compare los resultados de este caso con
el de los sueldos. ¿Qué conclusiones puede sacar?
1.2. Estadísticos de dispersión.

Para caracterizar una muestra, en general no alcanza con dar una medida de
tendencia central. Conviene acá introducir otro concepto, el de dispersión de una
muestra.
Supongamos que tenemos dos muestras correspondientes a productos fabricados con
el mismo proceso pero con dos máquinas distintas I y II. Se mide una misma
característica de cada uno de los productos y se obtiene
Máquina I 2,31 2,33 2,30 2,31 2,32 2,32 2,33 2,31 2,34 2,30
Máquina II 2,33 2,35 2,36 2,40 2,32 2,31 2,28 2,25 2,23 2,27
Los promedios obtenidos para ambas muestras son semejantes entre sí: 2,32 y 2,31
Sin embargo, un mero análisis visual nos revela una diferencia: Los valores de la
muestra I son más cercanos entre sí que los de la II. Podemos decir que la muestra I
está más concentrada alrededor de su promedio, o que la II tiene más dispersión, por
lo tanto, será preferible la máquina 1, que producirá resultados más predecibles.
Este ejemplo nos muestra la necesidad de introducir estadísticos que nos den una
idea de la dispersión de los datos muestrales.
1.2.1.Rango. La forma más simple de hacerlo es considerar el rango de los datos.

Esto es, la diferencia entre el mayor y el menor de ellos.
R = max(x1,...,xn) - min(x1,...,xn)
En el ejemplo anterior resultan ser

RI = 2,34 - 2,30 = 0,04
RII = 2,40 - 2,23 = 0,17
El rango es un estadístico muy sencillo de calcular, sin embargo, es poco eficiente,

dado que no aprovecha bien toda la información contenida en la muestra, sino sólo
sus valores extremos. Por otro lado, y por este mismo motivo, es extremadamente
sensible a la presencia de valores anómalos.
1.2.2.Desviación estándar. Es este el estadístico más utilizado para medir la

dispersión de una muestra. La desviación estándar muestral s, se calcula como la
raíz cuadrada del promedio de las desviaciones cuadráticas de cada valor respecto
del promedio de la muestra:
( xi - x )2
s=
n-1
La justificación para la expresión anterior proviene del hecho de que, cuanto
más dispersa sea la muestra, más lejos de x estarán los datos, y mayor valor tendrán
las cantidades (xi- x )² (el uso del cuadrado garantiza que todas ellas sean mayores o
iguales que 0), y por lo tanto su promedio será también mayor cuanto más dispersa
sea la muestra (en lugar de dividir por n, se divide por n-1, por razones que veremos
más adelante). La extracción de la raíz compensa la elevación al cuadrado de las
diferencias, de forma tal que el s obtenido sea presentada en la misma escala y con
las mismas unidades que los datos originales. La varianza de una muestra es definida
como el cuadrado de su desviación estándar.
Ejercicio: Cálculo de los estadísticos de dispersión:

Calcule el rango y la desviación standard para las muestras de ambas
máquinas de más arriba,
usando las funciones de Excel:
 No hay una función propia para el rango, por lo que se calcula como la
diferencia de las funciones max y min
 La desviación standard se calcula mediante la función desvest Puede
veificar que, para los ejemplos de las máquinas, s I= 0,01 y s II = 0,05
(redondeados a dos decimales)
Notas: a. Para calcular s con ayuda de una calculadora con funciones estadísticas,
se debe usar la tecla  n-1
b. A pesar de la nota anterior, debemos advertir que, no debe confundirse la
desviación standard s aquí definida con la desviación standard de una población, , la
cual estudiaremos más adelante.
1.3. Estadístico de proporción. Al analizar una muestra de elementos por atributos

(por ejemplo, todo tipo de controles “pasa/no pasa”) puede ser necesario contar cuál
es la proporción de las unidades bajo inspección que presentan un atributo
determinado (por ejemplo, una falla). Para esto se utiliza la llamada “frecuencia
relativa” del atributo, esto es:
f  atributo 
fr  atributo  
n
donde f(atributo) es la frecuencia –absoluta- del atributo, o sea, la cantidad de
unidades ensayadas en que el atributo aparece, y n el tamaño de la muestra, o sea, la
cantidad total de unidades ensayadas. La frecuencia relativa indica pues la proporción
en que el atributo se encuentra en la muestra.
2. Técnicas gráficas.
2.1.HISTOGRAMAS Para entender la naturaleza de las desviaciones aleatorias,

utilizaremos una técnica estadística común, como es el histograma de los datos, que
se confecciona de la siguiente manera:
a)Se detecta primero el valor máximo y el valor mínimo medidos. A la diferencia entre
ambos se la denomina rango de las mediciones.
b)El intervalo correspondiente al rango es dividido en un cierto número de intervalo de

clases dentro de los cuales se agruparán los datos. Se puede utilizar la siguiente
fórmula aproximada para determinar el número de clases:
Número de clases  n
donde, como ya dijimos, n es el número de mediciones, o tamaño de la muestra.
c)Una vez fijadas las clases, se clasificarán los valores dentro de las mismas,
calculando las frecuencias y/o frecuencias relativas de cada intervalo (el número o
proporción de observaciones que caen en en cada intervalo) Es claro que la suma de
las frecuencias de todas las clases iguala el número total de datos:
 f(i) = n,
y, por lo tanto, que la suma de las frecuencias relativas será igual a 1:
 fr(i) = 1
d)Se realiza un gráfico de barras con las frecuencias (absolutas o relativas)
Ejemplo: Supongamos que medimos los diámetros de 20 piezas producidas por un

proceso, obteniendo s siguientes valores (en mm): 39,81 40,00 39,92 39,96 39,98
40,04 39,87 39,89 39,90 40,01 39,90 39,85 39,88, 39,88 39,96 39,88 39,90 39,91
39,87 39,99
El siguiente es el histograma correspondiente a las frecuencias relativas.

0.4
Ejercicio: Dada la siguiente muestra de 70 observaciones, construir varios
histogramas, para distintas configuraciones
n=20 de intervalos (por ejemplo, basados en 5
intervalos, en 10 intervalos
0.2
y en 15 intervalos). Luego, elegir la cantidad de
intervalos que mejor permita representar a los datos.(copiar y pegar)
0.484 0.482 0.423 0.539 0.463 0.596 0.368
0.432 0.480 0 0.454 0.518 0.411 0.415 0.583
0.514 0.577 0.419 0.449 0.403 0.530 0.432
0.573 0.495 0.480 0.487 0.447 0.551 0.464
0.569 0.490 0.498 0.507 0.458 0.612 0.543
0.600 0.472 0.502 0.531 0.390 0.495 0.526
0.386 0.615 0.482 0.508 0.469 0.471 0.550
0.487 0.549 0.629 0.451 0.478 0.538 0.534
0.562 0.640 0.408 0.610 0.507 0.479 0.427
0.442 0.464 0.460 0.527 0.480 0.543 0.440
Información contenida en un histograma

El histograma de una serie de observaciones resume toda la información estadística
de relevancia. En particular, es apreciable a simple vista el valor medio muestral, como
se ve en los histogramas superpuestos siguientes, correspondientes a dos muestras
similares pero cuyos valores medios (promedios o medianas, para el caso es lo
mismo) están corridos uno respecto del otro. Las flechas indican donde se posicionan
estos valores medios.
En el gráfico siguiente se representan dos histogramas de muestras con el mismo

valor medio pero diferente dispersión:
Además del valor medio y la dispersión, es importante observar la “forma” de los

histogramas (concepto similar a lo que más adelante llamaremos “distribución”. En
los tres caso siguientes vemos diferencias de forma.
 Las barras marrones representan una muestra cuyas frecuencias son más
o menos constantes para todos los intervalos (caso que puede aparecer si
tiramos un dado muchas veces, por ejemplo).
 Las barras celestes, en cambio revelan mayor frecuencia en la zona
central, y menores frecuencias al irnos alejarnos del centro, hacia los
costados. Además, este histograma presenta simetría alrededor del valor
central. Esto significa que la cantidad de unidades que tengan valores
mayores que valor medio (o del valor máximo) será más o menos igual a
la cantidad de unidades que tengan valores menores.
 Por último, las barras amarillas presentan un comportamiento no
simétrico. Hay mucha mayor frecuencia a la izquierda del intervalo de
altura máxima que a la derecha.
En el caso de la serie celeste, decimos que el histograma tiene “forma de

campana” o distribución normal. Aquí está de vuelta; .
Las propiedades estadísticas de casos como este serán estudiadas con gran detalle
más adelante.
Daremos por ahora que, si el histograma es simétrico, la mediana y el promedio

muestral toman valores muy similares entre sí. El alumno lo puede verificar
calculándolos en el ejemplo de los 20 diámetros.
Pregunta; si el histograma es asimétrico alargado hacia la izquierda (como la

serie amarilla) ¿será mayor el promedio o la mediana? ¿ y si es asimétrico
alargado hacia la derecha? Sugerimos volver a chequear el ejemplo de los
sueldos de más arriba, y confeccionar el histograma en ese caso.
2.2.Otras herramientas gráficas. Además de los histogramas, existen muchas otras

posibilidades para graficar datos. Algunas de ellas fueron consideadas como
herramientas básicas de la Calidad por Ishikawa, como el gráfico de Pareto, el
gráfico de correlación y los gráficos de control. Estos últimos serán vistos en
detalle en el módulo de CEP. Ahora veremos los otros dos.
2.2.1.Gráfico de Pareto (Pareto, 1848 -1923, economista)

Es una representación gráfica de las causas de fallas (sobre un producto, proceso o
sistema), y de acuerdo a la importancia de sus efectos, muy útil para la toma de
decisiones. El gráfico muestra claramente cuáles son las causas que tienen más
influencia. Juran, en los 50´s fomentó su uso en Calidad. El fundamento del gráfico de
Pareto es que, por lo general, el 20% de las causas son responsables del 80% de los
efectos. Es preciso, entonces, fijar prioridades para su corrección.
Se trata de agrupar las fallas registradas por tipos, y ordenar en forma decreciente las
proporciones de cada tipo de falla. Esta herramienta será vista nuevamente en un
módulo posterior, pero decimos acá que puede ser entendida como un histograma
para datos por atributos
2.2.2. Gráfico de correlación.
Es una representación gráfica de la relación entre dos variables o características. A

modo de ejemplo, se muestra una muestra de 30 circuitos electrónicos, a los cuales
se las ha medico su capacidad eléctrica (Y, en pF) y la separación entre pistas (X,
en µm).El gráfico de correlación evidencia que ambas variables están correlacionas:

al aumentar x aumenta y y viceversa. Dado que la capacidad es una característica
importante de la performance del producto, esta podrá ser controlada en el proceso
de elaboración controlando la separación entre pistas, lo cual resulta más sencillo
operativamente.
La correlación entre dos variables puede expresarse también cuantitativamente a
través del coeficiente de correlación R, el cual toma valores menores o iguales
que 1 (en valor absoluto). Cuanto más cercano a 1 es R, mayor será la correlación
entra ambas variables. Para el ejemplo anterior, en el gráfico puede apreciarse el
cuadrado del coeficiente de correlación entre ambas variables.
Trabajo práctico. Ejercicio global de aplicación

Para terminar, y a modo de síntesis de este capítulo, proponemos un ejercicio de
repaso sobre todos los contenidos de este módulo. Suponga que usted debe comprar
una cierta mercadería, y tres proveedores ofrecen sus productos. Dado que en la
empresa no se tienen conocimientos previos para evaluar a los proveedores, se
decide analizar una muestra típica de los productos ofrecidos por cada uno de ellos. A
continuación usted puede ver tres muestras de 50 unidades cada una,
correspondientes a cada proveedor. Se pide:
~
a) Calcular, x , x , R , s de cada muestra y comparar.
b) En su empresa manejan límites de especificación de 46.46 (inferior) y 50.04
(superior). Fuera de estos límites, los productos deben ser considerados defectuosos.
Calcular en cada caso, la proporción (frecuencia relativa) de productos defectuosos.
c) Realizar histogramas para cada muestra, y compararlos.
d) En base a todo lo anterior, ¿a qué proveedor propondría comprarle?
Proveedor 1 Proveedor 2 Proveedor 3

50.49 49.90 50.42
50.13 49.68 50.15
49.99 50.13 50.36
50.00 50.41 50.20
50.00 50.27 50.14
50.13 50.49 50.49
50.15 50.25 49.50
49.87 49.70 50.48
50.05 49.59 50.41
50.12 50.30 50.48
50.02 50.18 49.57
50.13 50.45 50.32
50.17 49.69 50.49
50.46 49.97 50.29
49.83 50.10 50.44
50.12 49.52 49.99
50.41 50.28 50.40
50.17 50.06 50.30
50.16 49.65 50.43
49.98 50.40 50.50
50.02 50.12 49.93
50.15 50.03 50.42
50.33 49.61 50.50
50.21 49.81 50.41
50.38 50.34 50.20
50.00 50.00 49.52
50.11 49.68 50.48
50.18 49.94 50.49
50.23 49.98 50.46
49.98 49.66 49.92
50.29 49.88 50.14
50.39 49.95 50.10
50.13 50.49 50.11
50.34 50.40 50.40
50.03 50.35 50.42
50.18 50.13 50.11
50.19 50.35 50.44
50.03 50.08 50.45
50.13 50.01 50.31
50.12 49.54 50.06
49.99 50.42 50.22
50.25 49.65 49.51
50.01 50.03 50.06
50.24 50.25 50.39
50.11 50.20 50.28
50.10 49.92 50.50
50.11 50.45 50.49
50.22 50.12 50.39
50.38 49.66 50.11
50.18 49.75 50.32
CAP. III INFERENCIA ESTADÍSTICA Y PROBABILIDAD
Este capítulo consta de tres partes. Primeramente, veremos el esquema básico de

la Inferencia Estadística, luego algunos conceptos relativos a poblaciones y
muestras, y por último abordaremos el cálculo básico de probabilidad.
Parte 1. EL PROCESO DE LA INFERENCIA ESTADÍSTICA
Hasta ahora trabajamos con datos referidos a muestras numéricas. A veces es

necesario ir más allá del análisis de una muestra. Deberemos encarar la relación entre
muestras y poblaciones. Entramos así a la Estadística Inferencial. El siguiente
esquema muestra una interpretación de lo que podemos llamar el proceso genérico
de la inferencia estadística.
Veremos en detalle las etapas de este proceso:
 La POBLACIÓN es la totalidad de las unidades bajo estudio (ISO 3534.

Definiciones y términos estadísticos). En una aplicación estadística, lo primero
es definir el alcance de la misma, esto es, nuestro objeto de estudio, al cual
llamamos población.
Por ejemplo, si una fábrica de pantalones desea estudiar la cantidad de
defectos superficiales de la tela en la producción de un mes, la población está
formada por todos los pantalones producidos ese mes. Si se desea saber con
qué frecuencia, en un cierto proceso, un horno supera una dada temperatura
admisible, la población en este caso es algo más difícil de imaginar, dado que
involucra a todas las posibles repeticiones del proceso que se realicen con ese
horno. En el primer caso la población es finita, mientras que en el segundo

diremos que es infinita.
 MUESTRA En general, por más que tratemos con poblaciones finitas, resulta
imposible o impracticable la inspección de todos los elementos de una
población. Una muestra es un subconjunto de elementos extraídos de la
población. En los ejemplos anteriores, una muestra está formada por los 80
pantalones que serán inspeccionados buscando defectos, o por 30
repeticiones del proceso de horneado en las que se medirá la temperatura
máxima.
Al número de elementos de la muestra (80 o 30 en los ejemplos) se lo llama
tamaño de la misma. Notaremos x1,...,xn a una muestra típica, de tamaño n.
Nota: Debemos distinguir entre muestra física y muestra estadística. Para un
estadístico, una muestra es un conjunto numérico, producto de observaciones o
mediciones sobre los elementos físicos. En el ejemplo de los pantalones, si nos
interesa la cantidad de defectos superficiales, en nuestra muestra x1,...,x80 cada
xi representa la cantidad de defectos en la i-ésima unidad inspeccionada. En
cambio, si nos interesara estudiar la resistencia de las costuras, deberíamos
realizar un ensayo de fuerza en cada unidad, siendo x i la fuerza que debió
hacerse para vencer la costura en la i-ésima. La misma muestra física (80
pantalones) generó 2 muestras estadísticas distintas.
 (Sub)proceso de muestreo:
POBLACIÓN MUESTRA
El proceso de muestreo debe ser encarado de forma tal que garantice que la
muestra sea lo más representativa posible de la población. Si eligiéramos por
ejemplo los 20 primeros pantalones producidos el primer día del mes, no
estaríamos haciendo lo correcto estadísticamente, dado que la muestra
obtenida no registraría cambios en la producción posteriores a su obtención.Se
trata de elegir la muestra al azar entre la población, esto es, de forma tal que
cada elemento de la población tenga igual chance de ser elegido. En cada
proceso de muestreo se deberá prestar atención a cómo generar muestras
representativas, atento a las características que estemos estudiando.
 DATOS En la clase anterior vimos con detalle los tipos de datos a utilizar, por
lo que no habláremos en detalle aquí. Sólo diremos que los datos son
resultados de la medición de la muestra.
 (Sub)proceso de medición (inspección, ensayo u observación):
MUESTRA D ATOS
Este proceso tiene también sus propias reglas. En el caso de medir

características físicas o químicas de la muestra, (temperatura del horno en las 30
repeticiones, resistencia de una muestra de piezas metálicas, concentración de
impurezas en 20 tarros de pintura) estas reglas se estudian en el área de Metrología
(ciencia de las mediciones). En caso de inspección u observación visual, es necesario
el adecuado entrenamiento del inspector, etc.
 (Sub)proceso de inferencia (estimación o ensayos de hipótesis):
DATOS POBLACION
Como ya se dijo, inferir significa sacar conclusiones sobre la población, a partir

de los datos muestrales. Es necesario adoptar criterios correctos de inferencia,
a fin de no sacar conclusiones equivocadas. En sucesivos capítulos nos
referiremos a esto último
 Decisión. Por último, recordemos que toda inferencia deriva en alguna toma de
decisión sobre la población, y que, si cualquiera de las etapas anteriores ha
sido ejecutada en forma incorrecta, se corre el riesgo de que la decisión sea
equivocada.
A continuación, mostraremos algunos ejemplos del proceso general de inferencia

estadística en diversas aplicaciones en Calidad
Aplicación: Aceptacion De Productos Por Ensayo De Muestreo . Se trata de

decidir si un lote de mercadería enviada por un proveedor alcanza o no cierta
calidad aceptable. En este caso, la población es el Lote completo, del cual se extrae
una muestra representativa para inspección. La inspección permite medir la calidad
de la muestra, por ejemplo, mediante el porcentaje de unidades no conformes en la
muestra. Finalmente, inferimos sobre la calidad del lote completo. La decisión
involucrada es la aceptación o rechazo del lote.
Por ejemplo, si el lote consiste de N = 200 unidades, de las cuales muestreamos n =
50 y en ellas encontramos 3 no conformes (6%), inferimos que aproximadamente el
6% del lote (12 unidades) será no conforme. Sobre la base de esta información
tomamos la decisión de aceptar o rechazar.
Aplicación: Control Estadistico De Procesos. En este caso se trata de determinar

si un proceso dado está bajo control, o sea, si funciona dentro o de
acuerdo a sus niveles históricos. La población corresponde al proceso
entero, a lo largo de un cierto período de tiempo. Seleccionamos
muestras a tiempos regulares, obteniendo así “fotografías instantáneas
del proceso. Estas muestras son medidas y se calculan algunos
estadísticos correspondientes al instante del control, como por ejemplo el
promedio o el rango de las unidades de la muestra extraída. Estos
valores son introducidos en un “gráfico de control”, verificándose si los
mismos quedan dentro de ciertos límites históricos (límites de control). Si
es así se dice (sed infiere) que el proceso está bajo control. Si no, se
infiere que está fuera de control y se toma la decisión de corregir el
proceso.
Parámetros Poblacionales Y Muestrales
La idea base a transmitir en esta parte es la siguiente:
Existen dos versiones para los principales conceptos o parámetros que se

utilizan en la Estadística:
 Versión poblacional
 Versión muestral
Para comenzar a tratar el tema, les pedimos que respondan la siguiente: ¿Cuál es la
probabilidad de que salga un 4 al tirar un dado?
Esta pregunta tiene, en rigor dos respuestas posibles:
1. Un resultado favorable entre 6, o sea, 1/6. A esta respuesta la podríamos llamar

“respuesta teórica” o, puesto que se basa en el conocimiento previo de cómo es
el dado, y no requiere ninguna experiencia previa (no requiere tirar el dado).
También podemos llamarla “respuesta poblacional” porque, en caso de que el
dado sea equilibrado, la sexta parte de “todas las (infinitas) tiradas posibles”
saldrán 4. En general, este tipo de respuestas esta asociado a “modelos” de la
realidad (dado equiibrado)
2. 2.La segunda respuesta posible requiere tirar el dado una cantidad de veces (n
veces, lo que correspondería a una muestra de todas las tiradas posibles) y
calcular la frecuencia relativa del resultado 4. A esta respuesta la podríamos
llamar “respuesta experimental muestral” y requiere siempre la realización de
una experiencia. El resultado obtenido es más general que el anterior, pues no
es necesaria la suposición del que el dado está equilibrado para que la
respuesta sea correcta.
En síntesis, observamos que el conocido concepto de probabilidad, o porcentaje
admite las dos versiones mencionadas, la poblacional y la muestral. Si decimos por
ejemplo que
“el 85% de nuestros clientes están
satisfechos con nuestro servicio”
y si al decirlo nos referimos a un dato ya conocido sobre la totalidad de clientes o

población estamos haciendo referencia a una proporción poblacional, equivalente a
decir que, si elegimos un cliente al azar, la probabilidad de que el mismo esté
satisfecho es igual a 0,85 (85%). Este tipo de afirmaciones poblacionales suele estar
basada en información previa, histórica. Sobre la misma población.
En cambio, si lo que queremos decir es que, de una muestra de clientes a los cuales
se les preguntó su nivel de satisfacción , el 85% de ellos respondieron
satisfactoriamente, hacemos referencia a un porcentaje muestral, que nos puede servir
para inferir sobre el nivel de satisfacción de la población entera, el cual no
conocemos. Las afirmaciones de carácter muestral siempre están basadas en
observaciones o mediciones sobre una muestra extraída.
Valor medio
Vimos en al capítulo anterior el concepto de “promedio muestral” Este concepto
también tiene una versión poblacional. Suponiendo que fuera posible medir la
totalidad de la población y aplicar la misma fórmula que para el cálculo del promedio
muestral con esta totalidad, obtendríamos así el promedio o media poblacional,
denotado  .
N
x i
= i=1
N
donde N es el tamaño de la población. En rigor, esta última fórmula es puramente
teórica, dado que no es posible conocer la totalidad de la población (la cual a veces se
considera infinita: N =  ). Sin embargo, la media poblacional suele relacionarse con
modelos matemáticos de la población, que permiten realizar cálculos teóricos, o bien
relacionarse con valores históricos. Es muy común, por ejemplo, asumir como a la
media histórica de un proceso.
Es de esperar que, si la muestra es representativa de la población, el promedio
muestral sea numéricamente cercano al poblacional, y que esta cercanía sea mayor
cuanto mayor sea n (tamaño muestral):
x
Esta propiedad, conocida como Ley de los Grandes Números, justifica el hecho de
estimar la media poblacional (difícil o imposible de calcular) a partir de la media
muestral.
Dispersión
De manera similar, si tuviéramos la información sobre la población entera, y
aplicáramos las fórmulas de la varianza y desviación standard a estos datos,
podríamos calcular la varianza y el desvío standard poblacionales, llamados  2 y 
respectivamente:
2
( x i - x ) ( x i - x )
2
 =
2
=
N N
Notas:
a) Valen las mismas consideraciones sobre el carácter teórico de estas fórmulas, que
hacíamos en el caso del promedio poblacional.
b) Observar que el denominador de estas fórmulas es N en lugar de por N-1. Dado
que N, el tamaño de la población, será siempre un número muy grande (a diferencia
de n, tamaño de la muestra, que puede ser pequeño), la diferencia entre dividir por N y
por N-1 será mínima.
c) Se suele confundir, en la práctica y en alguna bibliografía, las notaciones s con ,
designadas para desvíos standard muestrales y poblacionales respectivamente.
Nosotros mantendremos esta notación. Al igual que ocurre con la media, el desvío
standard muestral es un estimador del poblacional.
s   ;s 2   2
Esto de acuerdo a la Ley de los grandes números.
Distribuciones de probabilidad
Siguiendo los razonamientos anteriores, si tuviéramos la información de la población
entera, podríamos imaginar la realización de un histograma con todos estos datos. La
forma del gráfico resultante es llamada distribución de la población en estudio (o
distribución de probabilidad). La distribución caracteriza estadísticamente el
comportamiento de la población. El histograma obtenido a partir de una muestra se
convierte en una aproximación de la distribución poblacional, así como la media o la
desviación standard muestral estiman la media o la desviación standard
poblacionales.
Esto se puede visualizar en el siguiente gráfico, donde se observan histogramas
correspondientes a datos continuos.
En cuanto al gráfico anterior, es de destacar que, como el número de intervalos

aumenta al aumentar n, cada intervalo se va haciendo más angosto y en el límite la
distribución queda representada por una curva suave. En cambio, si las variables que
graficamos son discretas, la distribución toma la forma de un gráfico de barras, como
se verá en el próximo capítulo.
La distribución resume toda la información estadística de una población y permite

visualizar cómo es su variación aleatoria. En primer lugar, indica en forma aproximada,
donde se concentran la mayor parte de los datos. Algunas distribuciones tienen más
de un grupo de concentración. Estas se denominan polimodales. En general las
distribuciones asociadas con datos de producción son unimodales, o sea con un sólo
grupo de concentración, si el número de casos es grande. Las distribuciones
polimodales indican falta de homogeneidad en los datos. Por ejemplo productos
realizados con dos materias primas diferentes, o con dos máquinas diferentes.
No todas las distribuciones relacionadas con procesos industriales son simétricas. Hay
muchos casos donde hay simetría hacia la izquierda (asimetría positiva) o hacia la
derecha (asimetría negativa). En distribuciones con simetría positiva. la media es
mayor que la mediana, mientras que, con simetría negativa, sucede al revés.
Ejemplos típicos de asimetría (positiva) son distribuciones relacionadas con tiempos
de vida útil de una población de productos fabricados, los que serán estudiados en
Confiabilidad
Resumen: En la siguiente tabla se resume lo visto en esta parte sobre

características poblacionales y muestrales:
ENFOQUES
Características poblacional muestral
(parámetros) (teórico) (experimental)
De proporción probabilidad frecuencia relativa
De valor medio  x
De dispersión  s
De “forma” distribución histograma
Basado en variables aleatorias observaciones
Parte 3. Cálculo básico de probabilidades
Se vuelve necesario, ahora, introducir algunos conceptos de la Teoría de la

Probabilidad, la cual estudia los fenómenos y experiencias aleatorios. Un experimento
aleatorio es aquel cuyo resultado no conocemos, aunque sí conocemos el conjunto de
todos los posibles resultados que puede llegar a tener. Tal conjunto es llamado
espacio muestral, o espacio de eventos.
Ejemplos:
a) El ejemplo más simple de experiencia aleatoria es lanzar una moneda al aire y
observar de que lado cae. El espacio muestral está formado por los eventos "cara" y
"seca".
b) Si tiramos un dado, el espacio muestral consiste en los números enteros del 1 al 6.
c) Si la experiencia consiste en tirar una moneda la cantidad de veces necesaria
hasta obtener cara por primera vez, y contar el número de tiradas, los resultados
posibles son 1, 2, 3,... En este caso el espacio muestral es infinito, dado que, en teoría,
cualquier número entero positivo podría ocurrir.
d) Si la experiencia consiste en conectar una bombita de luz y registrar cuánto tiempo
pasa hasta que se queme, el espacio muestral consiste en todos los números positivos
y el 0.
e) De un lote de 10000 neumáticos fabricados se extrae una muestra de 30 a los que
se les realiza un ensayo de presión, contabilizando el número de defectuosos. El
espacio muestral consiste en el conjunto de números enteros entre 0 y 30.
f) Se cuenta el número de roturas o defectos en un largo tramo de tubos de gas. En
este caso, nuevamente, cualquier número entero positivo ( o 0) puede ser el resultado.
g) Se mide el diámetro de un cojinete; se sabe que no puede superar 35 mm. El

espacio muestral corresponde al intervalo limitado entre 0 35 mm.
h) Se mide la temperatura del agua de un motor, la cual, por consideraciones
técnicas, estamos seguros de que estará entre 60 0C y 95 0C . El espacio muestral
consiste en el intervalo [60 0C,95 0C].
i) En general, son experimentos aleatorios todos los procesos que involucran
mediciones de magnitudes físicas, dado que existen errores aleatorios de medición,
que modifican el resultado en forma no del todo predecible.
PROBABILIDAD
Todos los ejemplos anteriores tienen en común su aleatoriedad. Si repitiéramos
cualquiera de ellos varias veces, aunque las condiciones sean idénticas, seguramente
los resultados no serán los mismos, sino que variaran dentro de los límites del espacio
muestral en cada caso.
Llamamos evento o suceso a un grupo de uno o varios resultados, esto es, a un
subconjunto del espacio muestral. Sacar un número impar con el dado (ejemplo b), u
obtener un diámetro mayor a 30 mm (ejemplo g), son ejemplos de eventos. La
probabilidad de un evento es un número comprendido entre 0 y 1, relacionado con la
chance de ocurrencia de ese evento.
En los ejemplos a y b, si el dado o la moneda no están cargados, cada uno de los

resultados tendrá igual probabilidad de salir. Diremos en este caso que el espacio
muestral es equiprobable. En estos casos es sencillo calcular la probabilidad P de un
evento A, como el cociente entre la cantidad de elementos de A y la cantidad de
elementos del espacio muestral S:
número de elementos en A # A
P  A  
número de elementos en S # S
Por ejemplo, la probabilidad de que, al tirar un dado, ocurra el evento
A= {resultado mayor o igual que 5}
es P(A)=2/6. La probabilidad de obtener un resultado impar es:
P(impar)= 3/6= 0.5
La probabilidad de obtener cara al lanzar la moneda es
P(cara)= 1/2
En los otros ejemplos, los espacios muestrales no son equiprobables. En c, por caso,
intuitivamente resulta claro que será más probable sacar cara por primera vez en la
primera o segunda tirada, que en la número 100 . En tales casos, el cálculo de la

probabilidad de un evento es algo más complicado y requiere un modelo matemático
en particular, como veremos más adelante.
Nota: Indistintamente escribiremos la probabilidad como valor numérico – entre 0 y 1 -

o bien como porcentaje – entre 0% y 100%.
Por ejemplo podemos decir, indistintamente, “la probabilidad de que un trabajo sea
defectuoso es igual a 0,08 o del 8%”.
Probabilidad y frecuencia relativa: Como vimos antes, hay una directa relación entre
probabilidad y frecuencia relativa, Si tiramos un dado n veces la frecuencia relativa del
resultado "6", por ejemplo, se asemejará a la probabilidad teórica de obtener 6, 1/6 .
En general, si un dado experimento aleatorio es repetido un número grande (n) de
veces, y consideramos cualquier evento A, vale que:
fr(a)  P(A)
y más cercanos estarán ambos valores cuanto mayor sea n. En el límite (si
pudiésemos repetir la experiencia infinitas veces) diremos que fr(A) "converge" a P(A).
Esta es otra consecuencia de la Ley de los Grandes Números, mencionada más
arriba.
Repetimos pues que se presentan entonces dos enfoques para el mismo concepto. Si
queremos saber cuál es la probabilidad de obtener un 6 en el dado por ejemplo,
podríamos hacer el cociente 1/6 (probabilidad), o bien tirar el dado un número grande
de veces y dividir la cantidad de veces que salió 6 por la cantidad total de tiradas
(frecuencia relativa). Supongamos que lo tiramos 100 veces y obtenemos 10 seis.
fr(6)=0.16, mientras que P(6)= 1/6  0.17
En relación al ejemplo anterior,
“la probabilidad de que un trabajo sea defectuoso es igual a 0,08 o del 8%”.
da lugar a las dos lecturas siguientes:

 Al tomar un trabajo al azar, la probabilidad de que éste sea defectuoso, es igual
a 0,08 o el 8%
 Al tomar una muestra grande de trabajos, aproximadamente el 8% será
defectuoso
Como quizás usted ya comprendió, éstas son dos maneras diferentes de decir lo
mismo.
Otra forma de escribir la frecuencia relativa: En Estadística, el símbolo ^ significa

“estimado”. Así, como la frecuencia relativa del resultado 6 estima a la probabilidad,
podemos escribir
ˆ  0,16
p
que se lee “probabilidad estimada igual a 0,16”
Si, al tirar el dado 100 veces, obtenemo en cambio, una frecuencia relativa
fr(6) = 0,1
como este resultado difiere, del valor esperado
p = 1/6 = 0,17
habría lugar para dos conclusiones diferentes, si queremos explicar la diferencia entre
lo observado y lo esperado:
a) podemos suponer que esa diferencia es "aleatoria", esto es, que la frecuencia
relativa resultó baja sólo por azar, y que, si repetimos la experiencia más veces,
seguramente obtendríamos resultados más similares al valor esperado
b) o podemos suponer que el dado no es equilibrado y por tanto la probabilidad

real de seis es menor que 1/6. En tal caso, por más que repitamos la
experiencia muchas veces, no nos acercaríamos más al valor esperado 1/6.
Si se nos permite ilustrar este tema con una referencia poética, citamos un texto de
Borges:
“..el vago azar o las precisas leyes

que rigen este sueño, el Universo...”
Reflexiones de esta naturaleza, cuando es necesario determinar si determinado

fenómeno observado fue causado por “el vago azar” (comportamiento no atribuible a
ninguna causa específica, o más simplemente, a “causas aleatorias”), o más bien
por “precisas leyes” (comportamiento atribuible a una o más causas específicas o
asignables) se presentan no sólo en la poesía sino también, y habitualmente, en
tareas relacionadas con la calidad.
A modo de ejemplo, si sabemos que, en un proceso, la masa del 95% de las piezas
fabricadas en serie se encuentra entre 100g y 102g, pero luego de un cambio de
repuesto en la maquinaria se fabricaron dos piezas más, pesando 101,9 g y 102,0 g;
podemos preguntarnos: si tal resultado, diferente de lo anterior, fue sólo por azar, o
si el cambio de repuesto produjo alguna modificación significativa en la maquinaria.
Propiedades De La Probabilidad
La probabilidad asigna entonces un número a cada evento del espacio muestral, y
debe cumplir con las siguientes propiedades, las cuales serán útiles para la resolución
de los ejercicios próximos.
a) Para todo evento A, P(A)  0 y P(A)  1
Si un evento tiene probabilidad 0, lo llamaremos "evento imposible", y si tiene

probabilidad 1, lo llamaremos "evento seguro". El espacio muestral completo es un
evento seguro. (Si tiramos un dado, siempre saldrá un número entre 1 y 6)
b) Fórmula del complemento La probabilidad de que A no ocurra es igual a 1

menos la probabilidad de que ocurra P(Ac) = 1- P(A)
donde Ac es el complemento de A, esto es, el suceso opuesto. Por ejemplo, el

suceso “obtener 5 o 6 al tirar el dado” es el complemento del suceso “obtener ,1 2,
3 o 4 al tirar el dado” y por lo tanto
P(5 o 6) = 1- P(1, ,2, 3 o 4)
2/6 = 1 - 4/6
c) Fórmula de la suma (sucesos excluyentes) Dos eventos se llaman disjuntos o

excluyentes cuando no pueden ocurrir ambos al mismo tiempo. Si A y B son
excluyentes vale la fórmula de la suma:
P( A o B ) = P(A) + P(B)
o sea, la probabilidad de que ocurra alguno de los dos es la suma de las

probabilidades individuales. La probabilidad de obtener {par o 3} en el dado es
P(par o 3) = P(par) + P(3) = 3/6 + 1/6 = 4/6
dado que los eventos {par} y {3} son excluyentes; en cambio no ocurre lo mismo con
la probabilidad de obtener {impar o menor que 3} pues el evento {impar o menor que
3} consiste en {1,2,3,5}, siendo su probabilidad igual a 4/6, mientras que
P(impar) + P(menor que 3) = 3/6 + 2/6 =5/6.
d) Fórmula de la suma (en general) Dados dos eventos A y B (no necesariamente

excluyentes), la probabilidad de que ocurra alguno de los dos es:
P( A o B ) = P(A) + P(B) - P(A y B)
es decir, a la fórmula anterior hay que restarle la probabilidad de que ocurran al

mismo tiempo A y B. (Si los eventos fueran excluyentes, éste último término es 0, y
volvemos a la formula anterior). De acuerdo a esto la probabilidad de obtener {impar o
menor que 3} es:
P(impar o menor que 3) =

= P(impar) + P(menor que 3) - P(impar y menor que 3)=
= P(impar) + P(menor que 3) - P(1)=
= 3/6 + 2/6 - 1/6 =
= 4/6
Dos eventos se llaman independientes si la ocurrencia de uno no afecta la ocurrencia

del otro. Supongamos por ejemplo que tiramos una moneda una sino dos veces. El
espacio muestral consiste en los pares (cara,cara), (cara, seca), (seca, cara) y
(seca,seca), siendo la primer componente de cada para el resultado de la primera
tirada y el segundo, el de la segunda.
Los eventos {cara la primera tirada} y {cara la segunda tirada} son independientes,
dado que el resultado de la primera no tiene por qué afectar a la segunda.
e)Fórmula del producto: Dados dos eventos independientes A y B, la probabilidad

de que ocurran ambos al mismo tiempo es el producto de las probabilidades
individuales:
P( A y B) = P(A. P(B)
Por ejemplo la probabilidad de sacar cara las dos veces que se tiró la moneda es:
P(2 caras)
= P(cara la primera vez). P(cara la segunda vez)
= 2/4 . 2/4
= 1/4.
Atención!: Es común confundir eventos excluyentes con independientes, cuando

en realidad no es lo mismo; de hecho, si son excluyentes, la ocurrencia del primero
impide la del otro y por lo tanto nunca pueden ser independientes).
Ejemplos del uso de las propiedades de la probabilidad
1.¿cuál es la probabilidad de que al tirar un dado 4 veces salga

a) “ningún 6”
b) “al menos un 6”?
a) La probabilidad de que no salga ningún 6 puede entenderse como:
“no sale 6 en la primer tirada” y “no sale 6 en la segunda tirada”

y “no sale 6 en la tercera tirada” y “no sale 6 en la cuarta tirada”
En símbolos:
P(“ningún 6”)= P(“no 6” y “no 6” y “no 6” y “no 6”)
Como las tiradas se consideran independientes (lo que sale en una tirad no influye
sobre el resultado de las demás), se puede aplicar la fórmula del producto:
P(“ningún 6”)= P(no6). P(no6) . P(no6) . P(no6) =
P(no6)4 = (5/6)4 = 0,48 (o 48%)
b) Decir que sale “al menos un 6” es exactamente lo opuesto de decir “ningún

6” (el complemento) y por lo tanto
P(“al menos un 6”) = 1 - P (“ningún 6”) = 52%
En consecuencia, si se tira un dado 4 veces es aproximadamente igual de probable

sacar al menos un 6 que no sacar ninguno.
2. La producción en serie de una placa eléctrica tiene un 5% de unidades no

conformes. ¿cuál es la probabilidad de que, en una muestra de 30 de estas
piezas, funcionen todas ellas?
P(una pieza funcione) = 0,95
Suponiendo independencia y aplicando la fórmula del producto,
P(funcionen todas) = P(la 1ª. pieza funcioe y la 2ª. pieza funcione y.........y la 30ª
pieza funcione) = 0,95 . 0,95 . 0,95...... . 0,95== 0,95 30 = 0,21 (o 21%)
A continuación, y para cerrar esta parte, le proponemos otros ejercicios para

realizar:
Autoevaluación de Probabilidad:
1. En un lote de 200 tornillos hay 30 tornillos defectuosos. ¿cuál es la probabilidad
de que, al extraer un tornillo al azar, este resulte defectuoso?
2. Al realizar una encuesta a 500 clientes de una empresa de servicios, se observó
que 145 de ellos quedaron disconformes con el servicio brindado. Estimar la
probabilidad de que un nuevo cliente quede disconforme, si la empresa no toma
acciones correctivas.
3. Para estimar la calidad de un proveedor, quien entrega semanalmente lotes de
30 piezas de un producto, se tomó nota de la cantidad de piezas defectuosas
entregadas en las últimas 20 semanas:
i. 0 1 3 0 1 1 2 1 2 1
ii. 1 2 5 1 0 0 2 3 2 1
En base a esta información, ¿cómo estimaría el porcentaje de piezas

defectuosas para este proveedor?
4. ¿cuál es la probabilidad de que, al sacar una carta de un mazo de cartas
españolas, ,se obtenga un As o un Rey?
5. ¿cuál es la probabilidad de que, al sacar una carta de un mazo de cartas
españolas, ,se obtenga un As o una espada?
6. Los límites de especificación para una pieza son: Inferior 30,2 mm y Superior:
30,8 mm. Si el 0,5% de las piezas producidas cae por debajo del límite inferior y
el 0,8% cae por encima del límite superior, calcular, usando las propiedades
adecuadas de la probabilidad, el porcentaje de piezas aceptables.
7. En la producción de ciertos envases plásticos por inyección, es común que
aparezcan alguna de las siguientes fallas:
a)Burbujas, que aparecen en el 6% de los envases
b)Fallas de forma en el pico, que aparecen en el 3% de los envases
Ambos modos de fallas corresponden a momentos diferentes del proceso, y por
lo tanto pueden considerarse independientes entre sí. Responder, usando las
fórmulas de la suma y del producto:
¿cuál es el porcentaje de envases no conformes?, y ¿cuál es el porcentaje
de los envases que presentan ambos modos de fallas?
8. El motor de una heladera industrial consta de 300 componentes individuales. Se
considera que la heladera está en buenas condiciones sólo cuando sus 300
componentes funcionan. Por otro lado, éstos componentes son entregados por
diferentes proveedores que garantizan, todos ellos, un nivel de calidad del 99%,
o sea, no más del 1% de los componentes defectuosos en cada caso.
a)calcular la probabilidad de que la heladera pueda considerarse en buenas
condiciones, usando la fórmula del producto
b)en función de lo anterior, ¿cómo evaluaría la calidad de los proveedores, como

aceptable o insuficiente?
c)¿qué calidad mínima debiera exigirse a los proveedores si se desea que el
95% de las heladeras fabricadas esté en condiciones?
9. Una cámara tiene 2 bombas de desagüe, que funcionan independientemente.
La probabilidad de que la primera de descomponga es del 3%, y la probabilidad
de que la segunda de descomponga es del 6%. Para diseñar un plan de
contingencia se debe saber cuál es la probabilidad de que no funcione ninguna.
Calcular esta probabilidad.
10. Paradojas de la probabilidad y de la estadística. Las 4 afirmaciones siguientes
contienen errores en la utilización de distintos conceptos probabilísticos o estadísticos.
Encontrarlos y rebatir las afirmaciones
a) “Dicen que una de cada cinco personas nació en China. Estoy seguro que eso
no es posible. Yo tengo como 15 amigos, 20 parientes, Don Tito el carnicero y su
familia, la barra del club, y los González. Todos juntos son cerca de 80, y
ninguno de ellos nació en China“
b) En un reportaje que le hicieron cuando era presidente de EEUU, en la década del

50, Dwight Eisenhower expresa asombro y preocupación al enterarse que, según
investigaciones, “la mitad de los norteamericanos tenía una coeficiente intelectual
por debajo de la media...”
[citado por C. Sagan en su último libro]
Si usted fuera Eisenhower, ¿debiera realmente preocuparse?
c) Le dijeron al Sr. Marino que la probabilidad de haya una bomba en un avión es

de uno en mil (1/1000). Por lo tanto, haciendo un cálculo rápido, concluimos que la
probabilidad de que en el mismo avión haya dos bombas es de 1/1000 x 1/1000 =
1/1000000. (uno en un millón). Para viajar más tranquilo, cada vez que el Sr. Marino
viaja en avión lleva una bomba en su equipaje. De esa manera, como la probabilidad
de que haya dos es tan baja, él está casi seguro de que no habrá otra más que la que
lleva él, que está desactivada.
d) CLEMENTE, de Clarín del 4/4/97
Cap. IV. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE

PROBABILIDAD
Vimos en el capítulo anterior las bases de la Teoría de la Probabilidad. Ahora

desarrollaremos los conceptos de variables aleatorias, para vincular aquellos
elementos con los datos numéricos.
Una variable aleatoria es un resultado numérico de un experimento aleatorio. Dicho

de otro modo, definimos variables aleatorias si asignamos un valor numérico a cada
resultado de un experimento aleatorio. Por ejemplo, podemos concebir el trabajo de
inspeccionar una muestra de 20 productos, y contar el número total de defectuosos
entre ellos como un experimento aleatorio, puesto que no podemos saber, a priori,
cuáles unidades serán buenas y cuáles serán defectuosas. Una variable aleatoria
asociada a este experimento aleatorio puede ser el “número de productos
defectuosos encontrados”. Dada la propia aleatoriedad del problema, no podemos
conocer a priori qué valor numérico tomará esta variable aleatoria, sólo podemos
asegurar que ese valor estará entre 0 y 20. Nos puede interesar conocer, a priori de la
inspección, la probabilidad de no encontrar ningún defectuoso, o bien de encontrar
sólo 1, o bien de encontrar más de 3, etc.
Para responder a estas preguntas, cada variable aleatoria está caracterizada por una
distribución de probabilidad, que asigna un valor de probabilidad a cada resultado
posible.
En el caso de los ensayos discretos, la distribución de probabilidad es una función que

asigna un número a cada resultado (su probabilidad). Por ejemplo, la distribución de
probabilidad asociada a la tirada de un dado es la función que asigna el valor 1/6 a
cada uno de los posibles resultados:
resultado x 1 2 3 4 5 6
probabilidad p(x) 1/6 1/6 1/6 1/6 1/6 1/6
Está claro que, como la probabilidad total debe ser siempre igual a 1, debe valer que
p(k) = 1
donde p es la distribución de probabilidad, y la suma se realiza sobre todos los
resultados posibles La distribución de probabilidad cumple un papel similar al del
histograma de la distribución poblacional cuando la población es infinita. Si tiramos un
dado un número grande de veces y realizamos el histograma correspondiente a los
resultados, éste se asemejará al gráfico de la distribución de probabilidad.
MEDIA Y VARIANZA DE VARIABLES ALEATORIAS

Es necesario también poder calcular un parámetro de localización o tendencia central
para una variable aleatoria X, así como se hacía con las muestras. Este parámetro
representará el valor medio (teórico) de la misma. Lo llamaremos media poblacional o
esperanza de la v.a., y, para calcularla, partimos de la fórmula equivalente para
muestras con datos agrupados, reemplazando la frecuencia relativa que ahí aparecía
por la probabilidad:
   x  p x 
donde E(X) se lee "esperanza de X", la suma se da sobre todos los x del espacio
muestral, y p(x) es la distribución de probabilidades de la v.a. X. La esperanza de una
variable puede ser también interpretada como su valor esperado, esto es, como el
valor que esperaríamos que tome la variable antes de la realización del experimento.
En nuestro ejemplo del dado, la esperanza es:
De manera análoga se puede calcular la varianza y desvío standard de

variables aleatorias,   y
DISTRIBUCIONES ESPECIALES
Veremos ahora algunas de las distribuciones más utilizadas en la práctica. En primer
lugar, trataremos con distribuciones discretas.
V: DISTRIBUCIÓN BINOMIAL
Consideremos un experimento que tiene sólo dos resultados posibles, como

cara-seca, o defectuoso-no defectuoso, y supongamos por ahora que conocemos la
probabilidad de ambos resultados. A alguno de los dos resultados posibles lo
llamaremos suceso , y a su probabilidad, p. Ahora imaginemos que el mismo
experimento es repetido una cantidad n de veces, siempre bajo las mismas
condiciones y en forma independiente (esto es, sin que el resultado en cualquiera de
las repeticiones influya en los resultados de las otras). Consideremos entonces a la
variable aleatoria que cuenta la cantidad de sucesos obtenidos en las n repeticiones.
Ejemplos de esto son, el número de caras obtenidas al tirar una moneda n veces, o el
número de piezas defectuosas encontradas al inspeccionar una muestra de n piezas.
Las variables aleatorias que respondan a este esquema se dice que siguen una
distribución binomial, teniendo como parámetros a los valores n y p. En símbolos:
X » Bi (n,p)
Los parámetros de una distribución (n y p en este caso) son valores que la

caracterizan, en algunos casos son conocidos y en otros no.
La distribución binomial cumple un rol fundamental en todos los procesos de muestreo

de productos. Aquí, p es la proporción (poblacional) de productos defectuosos, o , lo
que es lo mismo, la probabilidad de que un producto elegido al azar de la población,
resulte defectuoso. Se presentan dos enfoques distintos.
a)Población finita -un lote grande ya producido-. p será considerado la proporción de

defectuosos en el
mismo . Para conocer p debiéramos inspeccionar el 100% del lote. Como esto no
resulta práctico, extraemos una muestra de tamaño n, y contamos la cantidad X de
defectuosos en la muestra.
b) Población infinita. Supongamos que queremos conocer la proporción de artículos
defectuosos que produce un determinado proceso. Acá no tenemos un lote ya
producido, sino que la población consiste en todos los artículos que se podrían llegar a
producir. En este caso, p es interpretado como la probabilidad (teórica) de que un
artículo producido sea defectuoso. En este caso, también se toma una muestra de
tamaño n, y se cuentan los defectuosos, obteniendo la v.a. binomial X.
Interesa saber, dadas n y p, cuál es la distribución de probabilidad de una v.a.

binomial, esto es, cuál es la probabilidad de que X tome un dado valor. Esto responde
a:
n!
p(i) = P(X = i) = p i (1- p ) n-i
i!(n - i)!
para i=0,1,...,n En la fórmula anterior, el símbolo ! representa el factorial.

Esperanza y varianza. Dados n y p, la esperanza y varianza de una distribución
binomial Bi(n,p) son:
 = n.p ; ² = n.p.(1-p)
Ejemplo prácticoUna cadena de hamburguesas y comida rápida planifica una

nueva sucursal en una capital provincial, en la que se van a utilizar, por turno, 50
empleados para atender al público. En realidad, 45
personas son suficientes para la atención del público
en un turno, pero se contratará a 50 para cubrir la
posibilidad de empleados faltantes por enfermedad u
otros motivos. Si, en alguna oportunidad, llegaren a
faltar más de 5 empleados, se deberá requerir personal
de refuerzo para asegurar el Sin embargo, la empresa prefiere manejarse solamente

con el personal originalmente contratado.
Teniendo en cuenta que, de acuerdo a la experiencia recogida en otras sucursales
ya existentes, se prevé una proporción promedio de empleados ausentes del 8%, la
gerencia se pregunta si los 50 empleados serán suficientes para no necesitar la
contratación de personal de refuerzo.
La pregunta a formular es, pues: contando con 50 empleados originales,

¿con qué frecuencia se necesitará llamar a personal de refuerzo? o, en
otras palabras, ¿con qué frecuencia se ausentarán más de 5 empleados?
Se dijo que el porcentaje promedio de empleados ausentes en la población, es
p = 8%
(En base a la experiencia previa de otras sucursales, se toma éste último como
parámetro poblacional)
Primero estimaremos, a partir de este dato, con qué frecuencia se pueden esperar
los posibles valores para el número de empleados ausentes en la nueva sucursal.
Frecuencia (x)
10
9
8
7
6
5
4
3
2
1
0 1 2 3 4 5 6 7 8 9 10 11 12
(x)
Ahora, calcule la frecuencia relativa y grafique el resultado en la próxima figura para

cada uno de los sucesos observados, teniendo en cuenta que la frecuencia relativa
se define como el cociente de la frecuencia por el número de ensayos n
f  x
fr  x  
n
De esta manera, y si nos basáramos solamente en esta información, kntente

responder:
¿con qué frecuencia no falta ningún empleado?................................................
¿con qué frecuencia se ausentan 3 empleados? ..............................................
¿con qué frecuencia se ausentan 5 empleados o menos? ...............................
¿con qué frecuencia se ausentan 5 empleados o menos? ...............................
En conclusión, ¿serán suficientes 50 empleados? .............................................
Es indudable que encontramos una solución para el problema planteado. Sin
embargo, la misma está lejos de ser la mejor solución posible. En primer lugar,
porque no es demasiado práctico recurrir a la caja de bolitas cada vez que se
plantea un problema similar a este. Pero además, porque esta solución es muy
dependiente de la aleatoriedad de las experiencias realizadas con la caja. Si
volviéramos a repetir todas las tiradas otra vez, posiblemente obtendríamos
diferente resultado.
Si, en cambio, se hicieran muchas más repeticiones con la caja de bolitas, la

influencia del azar sobre el resultado total será cada vez más pequeña. Un
matemático diría: si se realizan infinitas repeticiones, el resultado ya no quedaría
influenciado por el azar en absoluto. Las frecuencias relativas h(x) de la Figura
anterior (muestrales) pasarían a ser las probabilidades g(x) (poblacionales)
fr  x    
 p  x 
n
Afortunadamente, las infinitas repeticiones pueden ser reemplazadas por un cálculo

matemático. En la tabla siguiente se representa el resultado de este cálculo: la
función de probabilidad g(x) correspondiente, llamada Distribución Binomial, con
n = 50 y p = 0,08. A su vez, los valores de la tabla fueron transportados en el
gráfico de barras de la derecha.
p(x) es la probabilidad individual, o sea la probabilidad

de encontrar exactamente x unidades con determinado
atributo (“empleado ausente”) entre los n ítems
ensayados (“50 empleados”)
x p(x)
0 1.5%
1 6.7%
2 14.3%
3 19.9%
4 20.4%
5 16.3%
6 10.6%
7 5.8%
8 2.7%
9 1.1%
10 0.4%
11 0.1%
12 0.0%
Como ya se dijo, los valores de la tabla (y el gráfico) fueron calculados, no

repitiendo la tirada con la caja “muchísimas veces”, sino por medio de las fórmulas
de la página 3-7. Es interesante comparar este gráfico de barras (de
probabilidades) con el gráfico de frecuencias relativas anterior. Nuevamente,
comparamos un elemento muestral con uno poblacional.
Siguiendo con el ejemplo: Para calcular la probabilidad de un máximo de cinco

empleados ausentes, se suman las probabilidades individuales. De esta manera se
obtiene la función de distribución F(x).
F(5) = p(O) + p(1) + p(2) + p(3) + p(4) + p(5)
F(x) es la probabilidad acumulada, o sea la probabilidad de

encontrar hasta (máximo) x unidades con determinado
atributo entre los n ítems
La probabilidad de como máximo cinco empleados ausentes enfermos es

F(5) =
La probabilidad para más de cinco ausentes es:
1 - F(5) =
Si hacemos referencia al problema planteado, esto significa que, en
aproximadamente el de los casos se deberá solicitar personal de
refuerzo.
%
En base a estos resultados, ¿qué decisión tomaría?
DISTRIBUCIÓN DE POISON
Otra distribución discreta útil es la distribución de Poison, que suele describir los
experimentos aleatorios relacionados con conteos del número de defectos en una
unidad, o el número de errores en un proceso, o el número de accidentes producidos
por unidad de tiempo, etc. La distribución de Poison , P() , responde a un parámetro,
, y la fórmula de su distribución es:
-
e .
i
p(i) = ; i = 0,1,2,3,.
i!
La esperanza de una v.a. de Poison es , y la varianza , nuevamente, es 
EJERCICIO El servidor de una red informática recibe correos para distribuir. Se

supone que la cantidad de correos recibidos por día sigue una distribución de
Poison. A continuación se muestran los registros de los tiempos en los que se
recibieron trabajos en un día laboral (entre las 8 y las 20 horas).
 Estimar, en base a esta información, el parámetro , y responder:
 ¿con qué probabilidad pueden llegar a recibirse más de 10 correos por hora?
 ¿con qué probabilidad pueden recibirse más de 40 correos por mañana (8h-12 h)?
8 h 6 min 16 seg 12 h 12 min 2 seg 16 h 29 min 47 seg
VII. DISTRIBUCION NORMAL
Entre las distribuciones de probabilidad la más importante es la llamada normal (DN),

cuya forma es similar a los histogramas con forma de campana descritos
anteriormente. Tal distribución depende de 2 parámetros valor medio poblacional
o esperanza) y (desviación estándar poblacional), y la expresión matemática de su
distribución es:
1  x 
 
2
f(x) = e   
2.  . 
En el caso particular en que =0 y , la distribución correspondiente se denomina
normal standard ( N(0,1) ).
La importancia de la distribución normal proviene del hecho de que, en la mayoría de

los casos en los que una variable aleatoria está sujeta a varias fuentes diferentes e
independientes de variación, en que cada variación por separado puede resultar
imperceptible pero la combinación de todas ellas sí afecta el resultado, la distribución
subyacente es normal. Sin embargo, hay que prevenir que no siempre una variable
aleatoria continua de estas características es normal. Hay distintas herramientas
estadísticas que permiten chequear cuándo una muestra de valores o variable
aleatoria continuas, tiene DN. Si tuviésemos una gran cantidad de datos, y
quisiéramos chequear su normalidad, podríamos construir el histograma
correspondiente y comparar su forma con la “campana”. Sin embargo, es preferible
utilizar el Gráfico de Probabilidad Normal, o Red de Probabilidad Normal.
Linealidad: Una propiedad importante de la distribución normal es la siguiente: Si X

tiene distribución normal, y llamamos Z a la variable aleatoria obtenida de X restándole
su media y dividiéndola por su desviación estándar , entonces Z tiene
distribución normal standard:
X
X  N ( ,  )  Z   N ( 0,1)

Esta última propiedad sirve para calcular probabilidades referida a variables normales,
ya que las probabilidades relacionadas con la distribuciones normales standard están
tabuladas. Por ejemplo, sea X una variable aleatoria con DN(2,2) (esto significa µ=2,
 =2); y queremos hallar P(X < 4):
 X-2 4-2
P(X < 4) = P <  = P(Z < 1) = 0.84
 2 2 
según la tabla.
Valores de probabilidad para la distribución normal. Diremos cuánto se alejan,

para un dado , los valores del valor medio  en la distribución normal: Dada una
variable aleatoria X con distribución normal:
a) La probabilidad de que X caiga en el intervalo comprendido entre y

es aproximadamente 68%;
b) La probabilidad de que X caiga en el intervalo comprendido entre  y
 es aproximadamente del 95,5%;
c) La probabilidad de que X caiga en el intervalo comprendido entre  y
 es aproximadamente del 99,73%
Estas 3 propiedades se representan gráficamente como sigue:
Otras propiedades, que serán útiles en el Capítulo 5, son las representadas en los
gráficos siguientes
CAP. V. ESTIMACIÓN DE PARÁMETROS
El problema fundamental de la Estadística es inferir propiedades de las distribuciones

a partir de las mismas propiedades, pero referidas a una muestra pequeña. En general
se trata de estimar parámetros desconocidos de un población, a partir de estadísticos
calculados sobre la muestra. Los ejemplos mas claros son estimar la media  de una
población a partir del promedioX de una muestra, o el desvío standard poblacional a
partir del desvío standard muestral s, o la probabilidad de ocurrencia de cierto evento,
p, a partir de la frecuencia relativa de las ocurrencias en una muestra. En forma
esquemática:
DATOS POBLACION
Es de esperar que haya un error de estimación, dado que las muestras sobre
los que se calculan los estadísticos siempre están sujetas a variaciones aleatorias.
Parte 1. INTERVALOS DE CONFIANZA
Es por esta última razón que generalmente no alcanza con dar un valor puntual para
estimar un parámetro, sino que es conveniente dar un intervalo, un rango de valores
que, con una probabilidad alta, cubra al parámetro.
Por ejemplo, partimos de una muestra aleatoria (o sea, una muestra X 1, ..., Xn de
variables aleatorias todas ellas con distribución N queremos dar un intervalo tal
que podamos asegurar que el verdadero parámetro , poblacional, esté contenido en
ese intervalo con probabilidad 0.95 .
El nivel de un intervalo de confianza es la probabilidad de que el mismo cubra al

parámetro. Suelen tomarse intervalos con nivel 0.95, o 0.99 . El nivel suele ser escrito
como 1-, donde , que debe ser un número pequeño (0.05, o 0.01), representa el
riesgo estadístico del método.
INTERVALOS DE CONFIANZA PARA MEDIAS. VARIANZA CONOCIDA.
Partiendo de una muestra aleatoria con distribución N(), donde  resulta conocida,
un intervalo de confianza para la media  es:
   
IC(  ) =  X - z/2 ; X + z/2 
 
 n n
donde z/2 es el valor obtenido de la tabla de la distribución normal, que deja a su

derecha un probabilidad de /2. Por ejemplo , si deseamos un intervalo de  =
95%, 2 = 2.5%, y entonces z2 = 1.96
DISTRIBUCIÓN t . EL CASO DE VARIANZA DESCONOCIDA.
Si no se conoce , el intervalo para  se obtiene de manera similar, reemplazando 

(desconocido) por s, el desvío standard de la muestra. Pero en este caso el valor de
z/2 debe ser reemplazado por el valor t/2,n-1 que se busca en las tablas de la
distribución "t" de Student (ver Apéndice). Esta es una nueva distribución, similar a la
normal, que depende de un parámetro n (llamado número de grados de libertad) , y
que , cuanto mayor sea n, más se parece a la normal. El hecho de estimar  por s
introduce un error adicional en los estadísticos considerados, y esa modificación se
refleja en la distribución t. El intervalo resulta:
 s s 
IC(  ) =  X - t /2,n -1 ; X + t /2,n -1 
 
 n n
DISTRIBUCIÓN  2 INTERVALOS DE CONFIANZA PARA VARIANZAS .
En otros casos puede ser necesario dar un intervalo de confianza para estimación de
2 o . Para esto introducimos la distribución " 2", cuyas tablas se encuentran en el
apéndice. La misma depende también de un parámetro n, llamado número de grados
de libertad, y relacionado con la precisión en la estimación de  por s. A diferencia de
las distribuciones normal y t, ésta no es simétrica. El valor X2,n es aquél que deja un
área igual a  a su izquierda en el gráfico de su distribución. El intervalo
correspondiente a ² es:
 
 s
2
s
2

IC(  2 ) =  (n - 1) ; (n - 1) 
  n -1,1-/2
2
 n -1,/2 
2
 
Parte2. TESTS DE HIPÓTESIS
En muchas otras ocasiones lo que interesa no es estimar un parámetro por un valor

puntual ni por un intervalo, sino solamente verificar si el mismo cumple o no
determinada condición. Por ejemplo, puede ser necesarIo asegurarse si la
concentración media (poblacional) de cierta sal en agua mineral no supera un valor
máximo tolerado, o si el ancho medio (poblacional) del paso de un rosca fileteada está
dentro de ciertos valores de especificación de plano, o si la proporción (poblacional) de
artículos defectuosos obtenidos en un proceso no supera el 1%, etcétera.
En todos estos casos el problema es similar. Se tiene un parámetro en estudio

(correspondiente a una población completa), y se admiten para él dos situaciones
posibles: dentro - fuera de especificación o de norma, proporción de defectuosos
mayor - menor o igual que 1%. Para resolver estos y otros problemas con estas
características se utiliza un Test de Hipótesis que, como toda otra técnica estadística,
utiliza la información contenida en una muestra, extraída de la población original, para
llegar a una conclusión.
En primer lugar debemos formular las 2 hipótesis a ser testeadas, por ejemplo:
 versus 
si  es concentración media, y 0 es la máxima tolerada.Tengamos en cuenta que no

se conoce el verdadero valor de  (media poblacional), pero si el máximo valor
tolerado 0
Dijimos antes que un test deberá basarse en estadísticos obtenidos a partir de

muestras aleatorias (una muestra de n botellas de agua a las que se mida la
concentración de sal, por ejemplo), para ayudarnos a decidir entre ambas hipótesis.
Dado que x será similar a , para valores altos de n, lo razonable sería considerar un
criterio como el siguiente : Si x resulta "grande" , decidir 0, y si resulta "chico",
decidir  Seguidamente diremos con mayor precisión que significan "grande" y
"chico".
Hay que tener en cuenta que, como todo método basado en muestras estadísticas,
existe la posibilidad de cometer errores aleatorios en resultado del test. Reconocemos
4 posibles situaciones :
a) la concentración media real es realmente menor o igual que la máxima tolerada, y

nuestro test registra esta realidad.
b) la concentración media real es realmente menor o igual que la máxima tolerada,

pero, por errores estadísticos, nuestro test nos dirá que la supera.
c) la concentración media real es realmente mayor que la máxima tolerada, pero, por
errores estadísticos, nuestro test nos dirá que es menor o igual.
d) la concentración media real es realmente mayor que la máxima tolerada, y nuestro

test registra esta realidad.
Sintéticamente:
RESULTADO DEL TEST
 
REALIDAD  a. sin error b. error II
 c. error I d. sin error
Como se ve, hay dos errores posibles. Uno de estos dos por lo general es considerado
más "grave", y será aquél que queramos controlar en lo posible. En nuestro ejemplo, el
error más "grave" será el c ("no darnos cuenta que la concentración supera la
tolerada"). Muchas veces la formulación de cuál es el error más grave es subjetiva y
no debe tomárselo en forma estricta. Por ejemplo, si un fabricante y un comprador
deciden hacer un test para chequear si determinado producto alcanza o no un
determinada característica de calidad, lo más "grave" para el fabricante será que del
test surja que no se alcanza la característica anunciada cuando en realidad sí se
alcanza, y por tanto se rechacen productos buenos; para el comprador, lo más grave
será que del test surja que se alcanza la característica esperada, cuando esto no es
cierto, y por tanto comprará productos malos.
En cualquier caso, una vez elegido el error cuyo riesgo se quiera controlar, al mismo
se le asigna el nombre "ERROR I", o "ERROR ". Al otro, al menos "grave", se lo
llama "ERROR II", o "ERROR "
Una vez nombrados los dos tipos de error, nombraremos las dos hipótesis.
Llamaremos Hipótesis Nula (H0) a la hipótesis verdadera del ERROR I. Llamaremos
Hipótesis Alternativa (Ha) a la hipótesis verdadera del ERROR II. O, en otras palabras,
ambos errores posibles pueden describirse como:
ERROR I: "rechazar la hipótesis nula cuando ésta es verdadera";
ERROR II: "aceptar la hipótesis nula cuando ésta es falsa".
El siguiente elemento que debemos definir es el nivel de un test. Llamaremos nivel (y

lo notaremos con la letra ), a la probabilidad de cometer error de tipo I:
 = P(ERROR I) = P(rechazar H0 si H0 es cierta)
Se tratará, (como en Intervalos de Confianza) de elegir valores pequeños de  para

plantear un test . Por lo general se toma = 0.1, 0.05, o 0.01 . Se designa con 
a la probabilidad de error de tipo II:
 = P(ERROR II) = P(aceptar H0 si H0 es falsa)
A diferencia que  no es elegido al comienzo del test, sino que toma un valor de
acuerdo a la muestra tratada. Cuanto más pequeño se exija que sea  mayor será 
Los otros dos elementos que necesitamos para plantear un test son: el estadístico del
mismo, o sea aquel valor numérico que calcularemos a partir de la muestra, y la región
de rechazo o criterio de rechazo. El criterio de rechazo es aquella condición que
deberá cumplir el estadístico del test, para rechazar la hipótesis nula. Posiblemente
esto se aclare bastante al empezar a plantear tests en concreto.
TESTS PARA MEDIAS.VARIANZA CONOCIDA
Supongamos que tenemos una muestra aleatoria X1,..., Xn, de variables todas ellas
con distribución N(). El desvío standard es conocido, y queremos testear :
Ho:  
A: vs.
Ha:  
al nivel  (o sea, tal que el riesgo , o probabilidad de decidir 0 cuando en realidad
0, sea ). Decíamos antes que era razonable rechazar Ho cuando el
promedio muestral es "grande", mayor que alguna cantidad límite, y aceptar Ho en
caso contrario. Esa cantidad límite se elige de manera tal, que la P(ERROR I) sea  si
0. Da acá surge el criterio de rechazo que define nuestro test :
Se rechaza H 0 si : Z > z
donde z es el correspondiente percentil de la distribución normal que deja área a la

derecha (ver Intervalos de Confianza), y Z, el estadístico de este test, es la media
muestral normalizada:
X - 0
Z =
/ n
Despejando x en la desigualdad de arriba, vemos que el criterio se puede enunciar

también así:

Se rechaza H 0 si : X > z + 0
n
que responde a lo dicho anteriormente, de rechazar Ho six superaba alguna cantidad

límite. Tomar el criterio de rechazo de esta manera nos garantiza que el nivel obtenido
sea el deseado:
P(ERROR I) = P(Z > z ) = 
puesto que, si 0, la media muestral tiene distribución N(n), y por tanto, Z
tiene distribución N(0,1).
Utilización del test: En la práctica, se procede de la siguiente manera: Calculamos el

estadístico Z (lo podemos hacer pues 0 es conocido, al igual que ), y lo comparamos
contra el valor límite o valor crítico que obtenemos de la tabla de la distribución normal.
Si se cumple el criterio de rechazo, podemos decir que Ho es falsa, y la probabilidad
que tenemos de equivocarnos es, a lo sumo, . En cambio, si no se cumple la
condición de rechazo, no es igualmente correcto afirmar que Ho es verdadera, dado
que el error que podríamos llegar a cometer si lo afirmamos es el ERROR II, y no
sabemos cuál es la probabilidad  de cometerlo. Esta podría ser muy grande y por
tanto es poco lo que podemos afirmar, a no ser que calculemos  y nos aseguremos
de que es pequeña.
Cuando se quiere confirmar una hipótesis sobre un parámetro, se debe entonces

colocar esa hipótesis en el lugar de Ha, y así, si se cumple la condición de rechazo,
podemos rechazar Ho seguros (salvo el riesgo , elegido pequeño) de no
equivocarnos. Si no se cumple la condición de rechazo, nada podemos afirmar. Esto
último se puede interpretar así: si no se cumple la condición de rechazo no hay
suficiente evidencia, o información en los datos de la muestra, como para llegar a una
conclusión válida. En tal caso, se puede intentar nuevamente el test con una muestra
mayor.
Hay otras dos posibilidades para el planteo de las hipótesis. Estas son:
Ho:  
B: vs.
Ha:  
y
Ho:  
C: vs.
Ha:  
La forma de construir los tests correspondientes similar. El mecanismo para el planteo

de cualquier test es similar. Solamente cambian los criterios de rechazo. Más abajo
damos una síntesis para los diferentes casos que se consideran en este curso. No
está de más decir que, en este tema, es conveniente una buena ejercitación para
refirmar los conceptos.
El caso  desconocido.
Si no conocemos , usamos es estadístico T, igual que en Intervalos de Confianza,
X - 0
T =
s/ n
con el criterio de rechazo: Se rechaza H 0 si : T > t  ,n-1

donde el valor crítico t,n-1 se encuentra en la tabla de la distribución t. Despejando x
en esta última ecuación, surge que el criterio derechazo se puede escribir también:
s
Se rechaza H 0 si : X > t  ,n-1 + 0
n
El caso asintótico:
Hasta ahora hemos trabajado con muestras X1,...Xn con distribución normal. Puede
ocurrir que esto no ocurra. Pero, si n es suficientemente grande, en virtud del Teorema
Central del Límite, es posible suponer distribuciones aproximadamente normales para
los promedios, obteniendo el mismo test que anteriormente.
Tests para :
También puede ser necesario testear hipótesis sobre , como:
Ho:  
A: vs.
Ha: 
El criterio de rechazo para este test es: Se rechaza H 0 si : X >   ,n-1 donde el valor
2
crítico se obtiene de la tabla de la distribución "chi" cuadrado, y el estadistico X es:

s2
X = (n - 1) 2
0
APÉNDICE I. Formulas para Intervalos de Confianza y Tests de

Hipótesis
INTERVALOS DE CONFIANZA

a) Para  conocido, distribución normal X  z 2
n
s
b) Para  desconocido, distribución normal X  t 2 ,n 1
n
p  1  p 
c) Para paproximación normal de la binomial) p  z  2 ; p  X n
n
TESTS DE HIPOTESIS
1. Para Distribución normal, conocido

X  0
Z
 n
Criterios de rechazo:
A: Ho:   0 Z > z

Ha:   0
B: Ho:    0 Z < -z

Ha:   0
C: Ho: =  0 Z > z

Ha:   0
3. Para Distribución normal, desconocido
X  0
T 
s n
A: T > tn-1
B: T < -tn-1
C: T > tn-1
3. Para pAproximación normal a la binomial

p  p0
Z
p0  1  p0 
n
A: Ho: p p0 Z > z

Ha: pp
B: Ho: p  p0 Z < -za

Ha: p < p0
C: Ho: p = p0 Z > za/2

Ha: p  p0
4. Para Distribución normal.

s2
X   n  1 2
0
A: Ho:   0 X >  2n-1

Ha:   0
B: Ho:    0 X <  21-n-1

Ha:   0
5. Para diferencia de medias:   Dos muestras, de tamaños m y n, con distribución

normal, independientes entre sí, y con distintas medias   yel mismo conocido
X1  X2
Z
1 1
 
m n
A: Ho:    2 Z > z

Ha:    2
B: Ho:     2 Z < -z
Ha:    2
C: Ho:  =  2 Z > z

Ha:    2
6. Para diferencia de medias:   Dos muestras, de tamaños m y n, con distribución

normal, independientes entre sí, y con distintas medias   yel mismo desconocido
X1  X 2
T
1 1
sp  
m n
 m  1  s2x   n  1  s2y
sp 
m n2
A: Ho:    2 T > tm+n-2

Ha:    2
B: Ho:     2 T < -tm+n-2

Ha:    2
C: Ho:  =  2 T > tm+n-2

Ha:    2
7. Para comparación de varianzas:   Dos muestras, de tamaños m y n, con

distribución normal, independientes entre sí.
s2
F  12
s2
Ho:    2 F > fm-1,n-1

Ha:    2
(recordar que f1-n-1,m-1 = 1 / fm-1,n-1)
APÉNDICE II: GLOSARIO

Muchas de las definiciones que aquí aparecen fueron extraídas de: ISO 3534 -1997
Statistics – Vocabulary and symbols.
Concepto Símbolo Definición

Parámetro que indica la interdependencia
(correlación lineal) entre series de observaciones
Coeficiente de correlación
R apareadas. Es un estimador del coeficiente de
muestral correlación poblacional.
Parámetro que indica la interdependencia

Coeficiente de correlación
 (correlación lineal) entre dos variables aleatorias.
poblacional Toma valores entre –1 y 1
Condición que debe cumplirse para tomar la
Criterio de rechazo
decisión de rechazar la hipótesis nula en un test
(condición de rechazo) de hipótesis
Curva que muestra, para un dado plan de
Curva característica de un
CO muestreo, la probabilidad de aceptar un lote
plan de muestreo como función de su calidad real
Resultados de observaciones, inspecciones,
Datos mediciones o ensayos
Datos que son resultado de mediciones físicas
Datos continuos sobre ítems de una muestra. Toman valores
numéricos reales
Datos que son resultado de conteos de
características cualitativas (atributos) sobre
Datos discretos ítems de una muestra. Por lo general toman
valores enteros.
No conformidad con requerimientos
Defecto especificados
Estimador de la desviación estándar poblacional,
calculada a partir de la fórmula
Desviación estándar
muestral
S
s
 x i  x
2
n 1
Desviación estándar
poblacional (de una  Raíz cuadrada positiva de la varianza
(sigma) poblacional
variable aleatoria)
 s Desviación estándar (poblacional o muestral)
Desviación estándar de un ; asignada a la variable aleatoria obtenida como
promedio n n promedio de otras n variables aleatorias
Distribución de probabilidad de la variable
aleatoria discreta que cuenta el número de ítems
con determinado atributo, de una muestra
Distribución binomial DB(n,p) ensayada de tamaño n, cuando la probabilidad
de ocurrencia de tal atributo en la población es
igual a p. Los ensayos de los diferentes ítems
deben ser independientes
Distribución de Poison DP() Distribución de probabilidad de la variable
aleatoria discreta que cuenta el número de

atributos encontrados en una muestra ´(unidad
de inspección) ensayada, cuando el número
medio de defectos por unidad de inspección en
la población es igual a 
Función que determina la probabilidad con la
Distribución de
que una variable aleatoria tome algún valor o
probabilidad pertenezca a un conjunto dado de valores
Distribución del cociente entre las varianzas
muestrales de dos muestras independientes. Los
parámetros de la distribución son el número de
Distribución F grados de libertad de ambas varianzas
muestrales, m-1 y n-1 si las muestras son de
tamaño m y n respectivamente.
Distribución de probabilidad de una variable
aleatoria continua cuya función de densidad
Distribución normal DN corresponde a la campana de Gauss, con valor
medio y desviación estándar 
Distribución normal
DN Distribución normal con parámetros  = 0 y  = 1
estándar
x
Distribución del cociente: obtenido a partir
s n
Distribución t (Student) de n variables aleatorias todas con la misma
distribución normal. Un parámetro de la
distribución es el número de grados de libertad
n-1
Distribución de la suma de los cuadrados de
variables aleatorias con distribución normal
estandarizada. El número de tales variables es
Distribución  2 (“chi un parámetro de la distribución (grados de
cuadrado” o “ji libertad). Dada una muestra de tamaño n, la
2
cuadrado”) s
varianza muestral estandarizada  n  1  2

tiene distribución 2 con n-1 grados de libertad
En un test de hipótesis, error que consiste en
Error de tipo I rechazar la hipótesis nula cuando ésta se
cumple
En un test de hipótesis, error que consiste en no
Error de tipo II rechazar (aceptar) la hipótesis nula cuando ésta
no se cumple
Conjunto de todos los resultados posibles de un
Espacio muestral S
experimento aleatorio
Declaración detallada que incluye un conjunto de
requerimientos para ser satisfechos por un
producto, material o proceso, indicando, si es
Especificación apropiado, el procedimiento por el cual puede
determinarse si los requerimientos dados son
satisfechos
Estadística descriptiva Rama de la Estadística que se ocupa de
describir datos muestrales, ya sea por técnicas

gráficas o numéricas
Cualquier función matemática obtenida a partir
Estadístico de los valores observados derivados de una
muestra
Proceso para obtener una variable aleatoria Z
con distribución normal estándar DN(0 , 1) a
partir de una variable aleatoria X con distribución
Estandarización normal cualquiera DN()
X 
X Z 

Operación hecha con el propósito de asignar, a
partir de valores observados en una muestra,
valores numéricos a los parámetros de una
Estimación distribución elegida como modelo estadístico de
la población a partir de la cual la muestra fue
extraída
Estimado (Valor estimado) Resultado de la operación de estimación
Evento Ver Suceso
Experiencia que previamente a su realización, no
Experimento aleatorio es posible conocer el resultado que se obtendrá,
pero sí se conocen todos los posibles resultados
Número de ítems en una muestra que caen en
Frecuencia F una determinada clase o que cumplen con un
determinado evento
Frecuencia relativa Cociente entre la frecuencia de una clase y el
Fr
(proporción muestral) tamaño de la muestra
Función de densidad de
Derivada, si existe, de la función de distribución
una variable aleatoria fx acumulada
continua
Función de distribución Función que da, para cada valor x la
acumulada de una Fx probabilidad de que la variable aleatoria X sea
variable aleatoria menor o igual que x, FX(x) = P(Xx)
Función de probabilidad Si xi es un valor que puede tomar la variable
aleatoria X,
puntual de una variable px px(xi) indica con que probabilidad puede tomar
aleatoria discreta ese valor
Parámetro que indica la cantidad de información
utilizada pare estimar una desviación estándar
poblacional a partir de una desviación estándar
Grados de libertad n-1 muestral. Una estimación simple, basada en una
muestra de tamaño n, tiene n-1 grados de
libertad
Hipótesis opuesta a la hipótesis nula.
Hipótesis alternativa Ha Usualmente es una hipótesis compuesta (por
ejemplo: < 3 ó > 3)
Hipótesis sometida a rechazo o no rechazo
Hipótesis nula H0 (aceptación) como resultado de un test de
hipótesis
Representación gráfica de una distribución de

Histograma frecuencias o de frecuencias relativas (en
general, mediante gráficos de barras)
Rama de la Estadística que se ocupa de obtener
Inferencia estadística conclusiones sobre la población bajo estudio a
partir de observaciones muestrales
Método que consiste en registrar, para cada ítem
de una población o de una muestra extraída de
una población, la presencia o ausencia de una
cierta característica cualitativa (atributo) y contar
Inspección por atributos cuántos ítems poseen o no poseen esa
característica
NOTA: El modelo de la distribución binomial se
suele aplicar a este tipo de inspección
Método que consiste en registrar, para cada ítem
de una población o de una muestra extraída de
Inspección por conteo de una población, l número de defectos por ítem o
defectos por cada 100 ítems
NOTA: El modelo de la distribución de Poison de
suele aplicar a este tipo de inspección
Método que consiste en medir una característica
cuantitativa para cada ítem de una población o
Inspección por variables de una muestra extraída de una población
NOTA: El modelo de la distribución normal se
puede aplicar a este tipo de inspección
Intervalo cuyos límites son calculados a partir de
estadísticos muestrales, y que cubren a un
Intervalo de confianza I.C. determinado parámetro poblacional con un
probabilidad dada (nivel de confianza)
Unidad individual bajo estudio. Valor observado
Ítem único
Mediana (poblacional) de 50 percentil de una distribución (ISO 3535). Valor
que deja el 50% de la distribución a la izquierda
una distribución de Med (valores menores) y el 50% a la derecha (valores
probabilidad mayores)
Valor que, al ordenar la muestra de menor a
mayor, deja el 50% de la muestra a la izquierda
(valores menores) y el 50% a la derecha (valores
Mediana muestral ~
x mayores). Se calcula como el valor central de la
muestra ordenada, si el tamaño de la misma es
impar, y el promedio aritmético de los dos
valores centrales, si es par.
Uno o más ítems (individuos) tomados de una
población que proveen información sobre la
Muestra misma y posiblemente sirva de base para una
decisión sobre la población o sobre el proceso
que la ha producido ()
Procedimiento utilizado para obtener una
Muestreo muestra
Nivel de calidad aceptable AQL Máximo porcentaje de ítems defectuosos (o
máximo número de defectos por 100 unidades)
que, para propósitos de inspección por
muestreo, puede ser considerado satisfactorio

como promedio del proceso de entrega
Nivel de confianza (de un
 Probabilidad de que un intervalo de confianza
intervalo de confianza) contenga a un parámetro poblacional
Nivel de un test de Probabilidad máxima para el error de tipo I en un
 test de hipótesis
hipótesis
En inspección por atributos, máximo valor para
Número de aceptación C el número de ítems defectuosos o de defectos
que involucre la aceptación del lote
En inspección por atributos, mínimo valor para el
Número de rechazo D número de ítems defectuosos o de defectos que
involucre el rechazo del lote
Proceso de observar, medir, ensayar,
Observación (medición, ,inspeccionar, calibrar y eventualmente compara
inspección, ensayo) los resultados obtenidos con requerimientos
aplicables
En una muestra, aquellos valores que, por
errores groseros en la observación, o por otros
Outliers, valores anómalos motivos no se les puede aplicar la misma
distribución de probabilidad que al resto de la
muestra
(por
Magnitud usada para describir la distribución de
Parámetro ejemplo: una característica de la población
p
Parámetro estimado p̂, 
ˆ , ˆ Ver Estimado (Valor estimado)
Percentil de la
distribución F, con m-1 y
f,m-1,n-1
n-1 grados de Grados de
libertad
Percentil de la Valor numérico que asegura que, si X es una
distribución normal z variable aleatoria con la citada distribución, la
estándar probabilidad de que X supere a dicho valor es
Percentil de la distribución t, igual a 
con n grados de libertad tn-1
Percentil de la
distribución  2, con n-1 2 n-1
grados de libertad
Plan que consiste en extraer una o más
muestras de una población para obtener
información sobre la misma y posiblemente
Plan de muestreo tomar una decisión
NOTA: Las decisiones involucradas pueden
consistir, por ejemplo, en aceptar o rechazar
lotes de mercadería
Totalidad de los ítems bajo consideración. El
Población objeto de estudio de un análisis estadístico
Probabilidad de un suceso P( ) Número entre 0 y 1 que cuantifica la chance de
ocurrencia de un suceso
Promedio aritmético, valor Suma de los valores que componen una muestra
x dividida por el tamaño de la misma
medio, promedio muestral
Probabilidad de que un ítem de una población
Proporción poblacional p cumpla con determinado atributo
Diferencia entre el mayor y el menor valor de
Rango R una muestra
Probabilidad de que, por efectos aleatorios, un
Riesgo del comprador lote sea aceptado, a pesar de que su calidad es
inferior a la especificada
Probabilidad de que, por efectos aleatorios, un
Riesgo del proveedor lote sea rechazado, a pesar de que su calidad es
igual o superior a especificada
Subconjunto del espacio muestral. Hecho que
Suceso puede o no ocurrir, de acuerdo a una
determinada probabilidad
Par de sucesos que no pueden ocurrir al mismo
Sucesos excluyentes tiempo
Par de sucesos para los cuales la ocurrencia o
Sucesos independientes no de uno de ellos no afecta para nada la
probabilidad de ocurrencia del otro
Número de ítems que componen una población
Tamaño de la población N (siempre y cuando la misma no sea infinita)
Tamaño de una muestra n Número de ítems que componen una muestra
Procedimiento estadística que pretende decidir si
una determinada hipótesis acerca de la
Tests de hipótesis distribución de una población debiera ser
aceptada o rechazada
Límite probabilístico del promedio muestral,
cuando el tamaño de la muestra tiende a 
Para variables aleatorias discretas, se calcula
Valor esperado de una mediante la fórmula    pi xi donde pi es la
variable aleatoria
 función de probabilidad puntual de la variable
(esperanza matemática, o aleatoria X evaluada en xi
valor medio poblacional) Para variables aleatorias continuas, se calcula
mediante la fórmula    x  f  x  donde f es la
función de densidad de la variable aleatoria X
Variables que pueden tomar cualquier valor en
Variables aleatorias x1,...,xn un conjunto de valores especificado y que tiene
asociada una distribución de probabilidad
Variables aleatorias que pueden tomar cualquier
Variables aleatorias
valor dentro de un intervalo de valores posibles
continuas (Ver: Datos continuos)
Variables aleatorias Variables aleatorias que sólo puede tomar
discretas valores aislados (Ver: Datos discretos)
Estimador de la varianza poblacional, calculada
Varianza muestral s2 a partir de la fórmula s 2  xi  x
2
n 1
Varianza poblacional El valor esperado del cuadrado de la variable

(varianza de una variable 2 centrada E  X   
2
aleatoria)
APÉNDICE III: TABLAS
1. Probabilidad acumulada a la izquierda de z, bajo la curva de la distribución normal

standard
DISTRIBUCION NORMAL STANDARD

ACUMULADA
z z z z
0 0.5000 2 0.9772
0.1 0.5398 2.1 0.9821
0.2 0.5793 2.2 0.9861
0.3 0.6179 2.3 0.9893
0.4 0.6554 2.4 0.9918
0.5 0.6915 2.5 0.9938
0.6 0.7257 2.6 0.9953
0.7 0.7580 2.7 0.9965
0.8 0.7881 2.8 0.9974
0.9 0.8159 2.9 0.9981
1 0.8413 3 0.9987
1.1 0.8643 3.1 0.9990
1.2 0.8849 3.2 0.9993
1.3 0.9032 3.3 0.9995
1.4 0.9192 3.4 0.9997
1.5 0.9332 3.5 0.9998
1.6 0.9452 3.6 0.9998
1.7 0.9554 3.7 0.9999
1.8 0.9641 3.8 0.9999
1.9 0.9713 3.9 1.0000
2.Valores críticos superiores de la Distribución t (dejan a la derecha un área igual a

 del total)
DISTRIBUCIÓN t DE UNA COLA (PARA TESTS CASOS A o B)

g.l. 0.5% 1.0% 2.5% 5.0% 10.0%
2 9.92 6.96 4.30 2.92 1.89
3 5.84 4.54 3.18 2.35 1.64
4 4.60 3.75 2.78 2.13 1.53
5 4.03 3.36 2.57 2.02 1.48
6 3.71 3.14 2.45 1.94 1.44
7 3.50 3.00 2.36 1.89 1.41
8 3.36 2.90 2.31 1.86 1.40
9 3.25 2.82 2.26 1.83 1.38
10 3.17 2.76 2.23 1.81 1.37
11 3.11 2.72 2.20 1.80 1.36
12 3.05 2.68 2.18 1.78 1.36
13 3.01 2.65 2.16 1.77 1.35
14 2.98 2.62 2.14 1.76 1.35
15 2.95 2.60 2.13 1.75 1.34
16 2.92 2.58 2.12 1.75 1.34
17 2.90 2.57 2.11 1.74 1.33
18 2.88 2.55 2.10 1.73 1.33
19 2.86 2.54 2.09 1.73 1.33
20 2.85 2.53 2.09 1.72 1.33
21 2.83 2.52 2.08 1.72 1.32
22 2.82 2.51 2.07 1.72 1.32
23 2.81 2.50 2.07 1.71 1.32
24 2.80 2.49 2.06 1.71 1.32
25 2.79 2.49 2.06 1.71 1.32
26 2.78 2.48 2.06 1.71 1.31
27 2.77 2.47 2.05 1.70 1.31
28 2.76 2.47 2.05 1.70 1.31
29 2.76 2.46 2.05 1.70 1.31
30 2.75 2.46 2.04 1.70 1.31
31 2.74 2.45 2.04 1.70 1.31
32 2.74 2.45 2.04 1.69 1.31
33 2.73 2.44 2.03 1.69 1.31
34 2.73 2.44 2.03 1.69 1.31
35 2.72 2.44 2.03 1.69 1.31
36 2.72 2.43 2.03 1.69 1.31
37 2.72 2.43 2.03 1.69 1.30
39 2.71 2.43 2.02 1.68 1.30
40 2.70 2.42 2.02 1.68 1.30
45 2.69 2.41 2.01 1.68 1.30
50 2.68 2.40 2.01 1.68 1.30
55 2.67 2.40 2.00 1.67 1.30
60 2.66 2.39 2.00 1.67 1.30
65 2.65 2.39 2.00 1.67 1.29
70 2.65 2.38 1.99 1.67 1.29
75 2.64 2.38 1.99 1.67 1.29
80 2.64 2.37 1.99 1.66 1.29
90 2.63 2.37 1.99 1.66 1.29
 2.58 2.33 1.96 1.65 1.28

3.Valores críticos superiores de la Distribución 2 (dejan a la derecha un área igual
a  del total)

g.l. 0.5% 1.0% 2.5% 5.0% 10.0% 90.0% 95.0% 97.5% 99.0% 99.5%
2 10.6 9.2 7.4 6.0 4.6 0.2 0.1 0.1 0.0 0.0
3 12.8 11.3 9.3 7.8 6.3 0.6 0.4 0.2 0.1 0.1
4 14.9 13.3 11.1 9.5 7.8 1.1 0.7 0.5 0.3 0.2
5 16.7 15.1 12.8 11.1 9.2 1.6 1.1 0.8 0.6 0.4
6 18.5 16.8 14.4 12.6 10.6 2.2 1.6 1.2 0.9 0.7
7 20.3 18.5 16.0 14.1 12.0 2.8 2.2 1.7 1.2 1.0
8 22.0 20.1 17.5 15.5 13.4 3.5 2.7 2.2 1.6 1.3
9 23.6 21.7 19.0 16.9 14.7 4.2 3.3 2.7 2.1 1.7
10 25.2 23.2 20.5 18.3 16.0 4.9 3.9 3.2 2.6 2.2
11 26.8 24.7 21.9 19.7 17.3 5.6 4.6 3.8 3.1 2.6
12 28.3 26.2 23.3 21.0 18.5 6.3 5.2 4.4 3.6 3.1
13 29.8 27.7 24.7 22.4 19.8 7.0 5.9 5.0 4.1 3.6
14 31.3 29.1 26.1 23.7 21.1 7.8 6.6 5.6 4.7 4.1
15 32.8 30.6 27.5 25.0 22.3 8.5 7.3 6.3 5.2 4.6
16 34.3 32.0 28.8 26.3 23.5 9.3 8.0 6.9 5.8 5.1
17 35.7 33.4 30.2 27.6 24.8 10.1 8.7 7.6 6.4 5.7
18 37.2 34.8 31.5 28.9 26.0 10.9 9.4 8.2 7.0 6.3
19 38.6 36.2 32.9 30.1 27.2 11.7 10.1 8.9 7.6 6.8
20 40.0 37.6 34.2 31.4 28.4 12.4 10.9 9.6 8.3 7.4
21 41.4 38.9 35.5 32.7 29.6 13.2 11.6 10.3 8.9 8.0
22 42.8 40.3 36.8 33.9 30.8 14.0 12.3 11.0 9.5 8.6
23 44.2 41.6 38.1 35.2 32.0 14.8 13.1 11.7 10.2 9.3
24 45.6 43.0 39.4 36.4 33.2 15.7 13.8 12.4 10.9 9.9
25 46.9 44.3 40.6 37.7 34.4 16.5 14.6 13.1 11.5 10.5
26 48.3 45.6 41.9 38.9 35.6 17.3 15.4 13.8 12.2 11.2
27 49.6 47.0 43.2 40.1 36.7 18.1 16.2 14.6 12.9 11.8
28 51.0 48.3 44.5 41.3 37.9 18.9 16.9 15.3 13.6 12.5
29 52.3 49.6 45.7 42.6 39.1 19.8 17.7 16.0 14.3 13.1
30 53.7 50.9 47.0 43.8 40.3 20.6 18.5 16.8 15.0 13.8
31 55.0 52.2 48.2 45.0 41.4 21.4 19.3 17.5 15.7 14.5
32 56.3 53.5 49.5 46.2 42.6 22.3 20.1 18.3 16.4 15.1
33 57.6 54.8 50.7 47.4 43.7 23.1 20.9 19.0 17.1 15.8
34 59.0 56.1 52.0 48.6 44.9 24.0 21.7 19.8 17.8 16.5
35 60.3 57.3 53.2 49.8 46.1 24.8 22.5 20.6 18.5 17.2
36 61.6 58.6 54.4 51.0 47.2 25.6 23.3 21.3 19.2 17.9
37 62.9 59.9 55.7 52.2 48.4 26.5 24.1 22.1 20.0 18.6
38 64.2 61.2 56.9 53.4 49.5 27.3 24.9 22.9 20.7 19.3
39 65.5 62.4 58.1 54.6 50.7 28.2 25.7 23.7 21.4 20.0
40 66.8 63.7 59.3 55.8 51.8 29.1 26.5 24.4 22.2 20.7
45 73.2 70.0 65.4 61.7 57.5 33.4 30.6 28.4 25.9 24.3
50 79.5 76.2 71.4 67.5 63.2 37.7 34.8 32.4 29.7 28.0
55 85.7 82.3 77.4 73.3 68.8 42.1 39.0 36.4 33.6 31.7
60 92.0 88.4 83.3 79.1 74.4 46.5 43.2 40.5 37.5 35.5
65 98.1 94.4 89.2 84.8 80.0 50.9 47.4 44.6 41.4 39.4
70 104.2 100.4 95.0 90.5 85.5 55.3 51.7 48.8 45.4 43.3
75 110.3 106.4 100.8 96.2 91.1 59.8 56.1 52.9 49.5 47.2
80 116.3 112.3 106.6 101.9 96.6 64.3 60.4 57.2 53.5 51.2
90 128.3 124.1 118.1 113.1 107.6 73.3 69.1 65.6 61.8 59.2
4a.Valores críticos superiores de la Distribución F, con  = 0.05 (dejan a la derecha
un área igual al 5% del total)
g.l. numerador
 =0.05
1 2 3 4 5 6 7 8 9 10 15 20 30 40 50
1 161 199 216 225 230 234 237 239 241 242 246 248 250 251 252
2 199.5 19.0 9.6 6.9 5.8 5.1 4.7 4.5 4.3 4.1 3.7 3.5 3.3 3.2 3.2
3 215.7 19.2 9.3 6.6 5.4 4.8 4.3 4.1 3.9 3.7 3.3 3.1 2.9 2.8 2.8
4 224.6 19.2 9.1 6.4 5.2 4.5 4.1 3.8 3.6 3.5 3.1 2.9 2.7 2.6 2.6
5 230.2 19.3 9.0 6.3 5.1 4.4 4.0 3.7 3.5 3.3 2.9 2.7 2.5 2.4 2.4
6 234.0 19.3 8.9 6.2 5.0 4.3 3.9 3.6 3.4 3.2 2.8 2.6 2.4 2.3 2.3
7 236.8 19.4 8.9 6.1 4.9 4.2 3.8 3.5 3.3 3.1 2.7 2.5 2.3 2.2 2.2
8 238.9 19.4 8.8 6.0 4.8 4.1 3.7 3.4 3.2 3.1 2.6 2.4 2.3 2.2 2.1
9 240.5 19.4 8.8 6.0 4.8 4.1 3.7 3.4 3.2 3.0 2.6 2.4 2.2 2.1 2.1
g.l. denominador
10 241.9 19.4 8.8 6.0 4.7 4.1 3.6 3.3 3.1 3.0 2.5 2.3 2.2 2.1 2.0
11 243.0 19.4 8.8 5.9 4.7 4.0 3.6 3.3 3.1 2.9 2.5 2.3 2.1 2.0 2.0
12 243.9 19.4 8.7 5.9 4.7 4.0 3.6 3.3 3.1 2.9 2.5 2.3 2.1 2.0 2.0
13 244.7 19.4 8.7 5.9 4.7 4.0 3.6 3.3 3.0 2.9 2.4 2.2 2.1 2.0 1.9
14 245.4 19.4 8.7 5.9 4.6 4.0 3.5 3.2 3.0 2.9 2.4 2.2 2.0 1.9 1.9
15 245.9 19.4 8.7 5.9 4.6 3.9 3.5 3.2 3.0 2.8 2.4 2.2 2.0 1.9 1.9
16 246.5 19.4 8.7 5.8 4.6 3.9 3.5 3.2 3.0 2.8 2.4 2.2 2.0 1.9 1.9
17 246.9 19.4 8.7 5.8 4.6 3.9 3.5 3.2 3.0 2.8 2.4 2.2 2.0 1.9 1.8
18 247.3 19.4 8.7 5.8 4.6 3.9 3.5 3.2 3.0 2.8 2.4 2.2 2.0 1.9 1.8
19 247.7 19.4 8.7 5.8 4.6 3.9 3.5 3.2 2.9 2.8 2.3 2.1 1.9 1.9 1.8
20 248.0 19.4 8.7 5.8 4.6 3.9 3.4 3.2 2.9 2.8 2.3 2.1 1.9 1.8 1.8
30 250.1 19.5 8.6 5.7 4.5 3.8 3.4 3.1 2.9 2.7 2.2 2.0 1.8 1.7 1.7
40 251.1 19.5 8.6 5.7 4.5 3.8 3.3 3.0 2.8 2.7 2.2 2.0 1.8 1.7 1.6
50 251.8 19.5 8.6 5.7 4.4 3.8 3.3 3.0 2.8 2.6 2.2 2.0 1.8 1.7 1.6
4b.Valores críticos superiores de la Distribución F, con  = 0.01 (dejan a la derecha

un área igual al 1% del total)
g.l. numerador
 =0.01
1 2 3 4 5 6 7 8 9 10 15 20 30 40 50
1 4052 199 216 225 230 234 237 239 241 242 246 248 250 251 252
2 98.5 19.0 19.2 19.2 19.3 19.3 19.4 19.4 19.4 19.4 19.4 19.4 19.5 19.5 19.5
3 34.1 9.6 9.3 9.1 9.0 8.9 8.9 8.8 8.8 8.8 8.7 8.7 8.6 8.6 8.6
4 21.2 6.9 6.6 6.4 6.3 6.2 6.1 6.0 6.0 6.0 5.9 5.8 5.7 5.7 5.7
5 16.3 5.8 5.4 5.2 5.1 5.0 4.9 4.8 4.8 4.7 4.6 4.6 4.5 4.5 4.4
6 13.7 5.1 4.8 4.5 4.4 4.3 4.2 4.1 4.1 4.1 3.9 3.9 3.8 3.8 3.8
7 12.2 4.7 4.3 4.1 4.0 3.9 3.8 3.7 3.7 3.6 3.5 3.4 3.4 3.3 3.3
8 11.3 4.5 4.1 3.8 3.7 3.6 3.5 3.4 3.4 3.3 3.2 3.2 3.1 3.0 3.0
9 10.6 4.3 3.9 3.6 3.5 3.4 3.3 3.2 3.2 3.1 3.0 2.9 2.9 2.8 2.8
g.l. denominador
10 10.0 4.1 3.7 3.5 3.3 3.2 3.1 3.1 3.0 3.0 2.8 2.8 2.7 2.7 2.6
11 9.6 4.0 3.6 3.4 3.2 3.1 3.0 2.9 2.9 2.9 2.7 2.6 2.6 2.5 2.5
12 9.3 3.9 3.5 3.3 3.1 3.0 2.9 2.8 2.8 2.8 2.6 2.5 2.5 2.4 2.4
13 9.1 3.8 3.4 3.2 3.0 2.9 2.8 2.8 2.7 2.7 2.5 2.5 2.4 2.3 2.3
14 8.9 3.7 3.3 3.1 3.0 2.8 2.8 2.7 2.6 2.6 2.5 2.4 2.3 2.3 2.2
15 8.7 3.7 3.3 3.1 2.9 2.8 2.7 2.6 2.6 2.5 2.4 2.3 2.2 2.2 2.2
16 8.5 3.6 3.2 3.0 2.9 2.7 2.7 2.6 2.5 2.5 2.4 2.3 2.2 2.2 2.1
17 8.4 3.6 3.2 3.0 2.8 2.7 2.6 2.5 2.5 2.4 2.3 2.2 2.1 2.1 2.1
18 8.3 3.6 3.2 2.9 2.8 2.7 2.6 2.5 2.5 2.4 2.3 2.2 2.1 2.1 2.0
19 8.2 3.5 3.1 2.9 2.7 2.6 2.5 2.5 2.4 2.4 2.2 2.2 2.1 2.0 2.0
20 8.1 3.5 3.1 2.9 2.7 2.6 2.5 2.4 2.4 2.3 2.2 2.1 2.0 2.0 2.0
30 7.6 3.3 2.9 2.7 2.5 2.4 2.3 2.3 2.2 2.2 2.0 1.9 1.8 1.8 1.8
40 7.3 3.2 2.8 2.6 2.4 2.3 2.2 2.2 2.1 2.1 1.9 1.8 1.7 1.7 1.7
50 7.2 3.2 2.8 2.6 2.4 2.3 2.2 2.1 2.1 2.0 1.9 1.8 1.7 1.6 1.6
APÉNDICE IV. EJERCICIOS DE APLICACIÓN

1. Un producto es elaborado en serie por dos líneas de producción, paralelamente. Se
tomaron dos muestras de 50 productos cada una, correspondientes a ambas líneas,
midiendo en cada caso una misma característica cuantitativa. Responder si es
verdadero o falso:
a) Si los dos histogramas correspondientes a cada línea por separado revelan
tener ambos distribución normal, entonces el histograma elaborado con la
muestra global de los 100 productos de ambas líneas, deberá mostrar
forzosamente una distribución normal.
b) El promedio de la muestra global de los 100 productos puede ser calculado
como el promedio de los promedios de ambas líneas
c) La desviación estándar muestral de los 100 productos deberá ser
forzosamente menor que la desviación estándar de ambas muestras por
separado.
d) Los siguientes datos representan los desvíos, expresados en milímetros,
respecto de un target de 150 mm para la longitud de una pieza producida por
dos máquinas en paralelo. Se tienen dos muestras de 50 unidades cada una:
1 4 1 1 2 6 0 -1 -2 4 4 3 3 2 3 1 3 4 1 5 3
Máq I 0 3 2 1 5 -2 3 4 1 3 5 2 4 4 3 2 5 -1 2 2 3
2 3 0 3 0 -1 1 4
-1 -5 0 -3 0 -1 -1 0 2 -4 1 2 0 0 1 0 1 -5 -1 -1 -4
Máq II -1 1 -2 -4 -3 -2 -1 0 1 -4 -3 0 -3 -1 0 -1 -2 1 0 -2 1
3 2 -3 0 -1 3 -2 1
Construir dos histogramas por separado para cada línea, y uno global para los
100 datos
c)Si las tolerancias para la longitud de esta pieza son 146 mm (límite inferior) y
154 mm (límite superior). Estimar la proporción de unidades no conformes en
cada muestra, y la proporción global.
d) Se precisa estimar las medias y desviaciones estándar poblacionales de
ambos procesos. ¿Cómo lo haría?
2. Si un sistema de refrigeración funciona con probabilidad 98%, y un sistema de

reserva se descompone el 3% de las veces,
a) la probabilidad de que no funcione ninguno es:
 menos del 1%,?
 menos del 0,1 %?,
 menos de 100 ppm?,
 menos de 10 ppm?
la probabilidad de que funcionen ambos sistemas es
 más del 90 %?
 más del 95 %?
 más del 99 %?
 más del 99.5 %?
3. Una cadena de hamburguesas y comida rápida está por abrir una nueva sucursal.
En base a estudios de mercado estima que serán necesarias 24 personas por turno
para cubrir todas las tareas. Por otro lado, los registros de otras sucursales indican un
porcentaje de ausentismo del 6% diario. Por lo tanto, para cubrir a los empleados
faltantes, deben contratarse algunas personas más que 24 por turno.
a) Si se contratan 25 personas por turno, ¿cuál será la probabilidad de que en un
turno cualquiera no se cubran las tareas necesarias?
b) Ídem, si se contratan a 26, 27, ..., 30 empleados por turno. ¿cuántos empleados
deberán contratarse para cumplir el objetivo de que sólo un día laborable por
mes no puedan cubrirse las tareas necesarias?(1 mes = 20 días laborables)
4. Dado que no todos los pasajeros de una aerolínea abordan el vuelo que han
reservado, la aerolínea vende 125 boletos para un vuelo de 120 asientos. Se sabe que
la probabilidad de que un pasajero no aborde el vuelo es de 0,10 y el comportamiento
es independiente.
a) ¿Cuál es la probabilidad de que todos los pasajeros quieran abordar el vuelo?
a) ¿Cuál es la probabilidad de que el vuelo quede vacío?
5. a) Un posible comprador de un lote desea realizar un muestreo para chequear

proporción de unidades defectuosas, con criterio de 0 defectos (o sea c = 0). ¿Cuán
grande debe ser la muestra para asegurar el rechazo del 95% de los lotes que posean
el 1,5% de defectuosos?
b) Ídem si trabaja con un criterio de aceptación de c=1, y de c=2
6. Si el número de baches en una ruta se toma como una variable aleatoria con media
de 2 baches por kilómetro:
a) Calcular la probabilidad de que no haya baches en un tramo de 5 km
b) Calcular la probabilidad de que haya al menos un bache en un tramo de 0,5 km.
7. En función de registros anteriores, se sabe que, en cierto tipo de tela, aparece una
media de 2 defectos de hilado por m2 de tela (se asume distribución de Poisson). Si
se inspecciona una muestra de 8 m2 de tela, ¿cuál será la probabilidad encontrar más
de 15 defectos en esa muestra? ¿y más de 20?
8. En la fabricación de maquinaria agrícola se utiliza gran cantidad de cierto tipo de

piezas cilíndricas. La especificación para sus diámetros es: 5,8 mm  0,2 mm. Para
la provisión de estas piezas han sido preseleccionados tres proveedores. Ellos
declaran los siguientes parámetros para sus productos:
µ  % NC (aproximado)
proveedor
(mm) (mm) inferior superior Total
A 5,600 0,005
B 5,85 0,05
C 5,8 0,1
a) Suponiendo distribución normal, calcular aproximadamente el porcentaje de

piezas no conformes que entregaría cada proveedor (última columna) y
recomendar a cuál elegir a igualdad de precio.
b) Si se eligen 25 piezas de B, calcular la probabilidad aproximada de que el
promedio de las mismas supere los 5,87 mm: ....................................
(NOTA: para este ejercicio no se requiere la tabla de la distribución normal)
9. Un proveedor entrega una determinada materia prima en paquetes. Por contrato, los
paquetes deben pesar más de 650 g . Sin embargo, el peso de cada paquete es una
variable aleatoria normal con µ = 656,5 g, y 2,5 g. Para una inspección de
recepción, se extraen 50 paquetes, si 48 o más de ellos cumplen con la especificación
prevista en el contrato, se acepta el envío. Calcular la probabilidad de que esto ocurra.
10. El peso neto de cereal una caja sigue una DN con µ= 600 g. El proceso de llenado
de cajas debe ser diseñado para que sólo una caja de cada 100 quede fuera del
intervalo 590 g - 610 g ¿Cuál deberá ser el  del proceso para alcanzar este objetivo?
11. a) Las tolerancias de un proceso son 1.500 0.005 . Un estudio basado en gran
cantidad de datos de ese proceso informó una media µ=1.502 y una desviación
estándar de  =0.002 . ¿cuál será la fracción defectuosa del proceso, suponiendo
distribución normal?
b) Si es posible corregir el centrado del proceso, poniendo a punto la máquina, ¿cuál
será ahora la fracción defectuosa del proceso?
c) Un estudio de capacidad de 4 máquinas similares arroja los siguientes resultados:
Máquina µ 
1 1,4950 0,0006
2 1,5021 0,0012
3 1,5000 0,0020
4 1,4979 0,0020
Ordenar las máquinas de peor a mejor, en el caso de que sea posible corregir el
centrado, y en el caso de que no lo sea.
12. En la fabricación de una alfombra se usa una fibra con una resistencia a la tracción
que tiene una distribución normal con media 75,5 psi y desviación estándar 3,5 psi.
Encuentre la probabilidad de que en una muestra aleatoria de n = 6, la media de la
resistencia a la tracción sea mayor que 75, 75 psi.
¿Cómo cambia la desviación estándar de la media muestral si el tamaño de la muestra
pasa a n = 49?
13. El límite máximo permitido de descarga de desechos sólidos a un río en una

ciudad es de 60 mg/l diarios. Un minucioso estudio realizado en muestras de agua
seleccionadas al azar del desecho de una fábrica durante un largo período de tiempo
permitió saber que la cantidad de sólidos descargados por día (en mg/l) es una v.a.
con µ = 52,  = 6.
a) Calcular la probabilidad de que en un día cualquiera la fábrica no cumpla el
requerimiento. (suponer distribución normal)
b) Calcular la probabilidad de que el promedio mensual de desechos no cumpla el
requerimiento. ¿Es necesaria aquí la suposición de normalidad de a?
14.a) Se desea determinar la concentración de cloruro de vinilo en una bebida

gaseosa envasada en botellas plásticas. Se toman 20 botellas de la producción de
una fábrica, determinando la concentración de cada botella, y promediando los 20
valores obtenidos. Si la muestra produjo una media de 0.5 ppm y una desviación
estándar s = 0.02 ppm, dar un I de C del 95 % para la concentración media.
b) Esta determinación debe ser realizada diariamente en la fábrica. Para abaratar el
ensayo, un ingeniero propone un método alternativo: mezclar volúmenes iguales de
cada una de las 20 botellas muestreadas, obteniendo así un único volumen, y realizar
sobre esta mezcla una única determinación. ¿Qué ventajas estadísticas tiene el primer
método sobre el segundo?
c) Se propone un tercer método, como una modificación del anterior: en lugar de
realizar una única determinación, se realizan 20 sobre la mezcla, promediando los
resultados. ¿Es este último método estadísticamente equivalente al primero?
15. Se desea dar un intervalo de confianza del 95% para el diámetro exterior de un
cierto tipo de roscas.
a) Si una muestra de 10 roscas presenta un diámetro promedio de 257 mm, y una
desviación estándar de 12 mm, ¿qué límites tiene el intervalo? ¿Qué suposición
estadística debe hacerse sobre los diámetros individuales de las roscas?
b) Si en lugar de utilizar la desviación estándar de la muestra dada se utiliza un valor
histórico de  = 13 mm como desvío estándar de los diámetros, ¿cómo cambia el
intervalo?
16. Un artículo científico describe las características de las varillas de combustible

usadas en un reactor nuclear para la generación de energía eléctrica. El porcentaje de
enriquecimiento medido en 12 varillas es el siguiente:
2,94 2,75 2,75 2,81
2,90 2,90 2,82 2,95

3,00 2,95 3,00 3,05
a) Encuentre un intervalo de confianza del 99% para el porcentaje promedio de
enriquecimiento.
b)¿está de acuerdo con la afirmación del artículo de que le porcentaje promedio de
enriquecimiento es del 2,95%?¿por qué?
17. Para llenar recipientes con un determinado producto líquido, se utiliza una máquina
llenadora. Se elige una muestra 10 recipientes, obteniendo un volumen de llenado
promedio de 1,026 litros. Si la desviación estándar histórica del proceso de llenado es
0,06 litros, obtener un intervalo de confianza para la media del proceso, y deducir si es
necesario tomar la decisión de ajustar la máquina llenadora.
18. Contestar si es V o F
a. Al aumentar el nivel de confianza de un intervalo, disminuye la precisión
b. Para duplicar la precisión de un intervalo de confianza para µ del 90%, hay que
duplicar el tamaño de la muestra.
c. (7.38 ; 8.21) es un intervalo de confianza del 95% para la media µ de un proceso.
Esto significa que el 95% de las mediciones realizadas están entre estos valores.
d. (7.38 ; 8.21) es un intervalo de confianza del 95% para la media µ de un proceso.
Esto significa que la probabilidad de que µ esté entre 7.38 y 8.21 es del 95% .
e. Si se repite 100 veces el proceso de estimación de la media µ de un proceso, por
intervalos de confianza del 95%, en aproximadamente 95 de las repeticiones el
intervalo obtenido cubre a µ.
f. Un intervalo de confianza puede ser utilizado para decidir si una determinada
característica de calidad se aparta significativamente de una especificación.
19. Un fabricante de tubos de gas afirma que la longitud de sus tubos tiene una
desviación estándar de 0.04 m. Un cliente que dispone de 7 tubos comprados a ese
fabricante, decide medirlos y obtiene una desviación estándar muestral de 0.054 m.
¿Alcanzan estos datos para refutar la afirmación del fabricante, al nivel 0.05? ¿y al
nivel 0.10? (suponer distribución normal)
20. En una muestra aleatoria de 30 focos, la desviación estándar muestral de la

duración de un foco es de 12,6 horas. Calcule un intervalo de confianza para la
varianza de la duración del foco.
21. Una especificación correspondiente al soporte de un cuadrante dice que debe

medir menos de 320 mm. Una muestra de 40 elementos generó una media de 320.8
mm, y una desviación estándar de 0.4mm Los datos obtenidos, ¿revelan que la media
del proceso es µ  321 mm?
22 a).Un posible comprador desea, antes de efectuar la compra de fibras que serán
utilizadas en fabricación de indumentaria, testear si la resistencia a la tensión de las

mismas es por lo menos de 125 psi. Experiencias previas indican que la desviación
estándar de la resistencia es de 2 psi. Se elige una muestra de 8 fibras, obteniendo
una resistencia media de 126 psi.
¿Cómo debe plantear las hipótesis del test, y qué decisión toma al nivel a =0.05?
b) El fabricante de las mismas fibras quiere estar seguro de que ellas tienen
resistencia menor a 125 psi antes de estudiar una posible mejora en el proceso. De
una muestra de 12 fibras obtiene una resistencia media de 122 psi. Contestar la
misma pregunta que en a.
23. Un nuevo sistema de purificación es instalado en un proceso químico. Antes de su

instalación, una muestra de 10 mediciones dio un porcentaje medio de impurezas de
9.85, con un desvío estándar de 8.27, y luego de la instalación, otra muestra de 8
mediciones produjo un porcentaje de impurezas de 8.08 con un desvío estándar de
7.46.
a) ¿Se puede concluir que las varianzas de ambos sistemas son iguales, o distintas,
con  = 0.10? (test F)
b) ¿Se puede concluir que las el nuevo sistema reduce el porcentaje de impurezas,
con  = 0.05? (test de Student)
24.a) Según una especificación, el valor medio de un proceso no debe bajar de 120.
Ante la sospecha de un posible descenso en ese valor medio, se quiere justificar
adecuadamente la decisión de ajustarlo, con un nivel del 5%. Para esto, se mide una
muestra de n =10 unidades, obteniendo un promedio de 119,6, con una desviación
estándar muestral de 1 ¿está debidamente justificada la decisión de ajustar la media
del proceso?
b) Repetir la respuesta anterior si la muestra tomada fue de n =36 unidades, habiendo
obtenido un promedio de 119,6, con una desviación estándar muestral de 1
25. Dos proveedores fabrican un engranaje de plástico una de cuyas características

clave es la resistencia al impacto. Una muestra aleatoria de 10 unidades del primer
proveedor dio por resultado x1 = 290 unidades y s1 = 12 unidades. Una muestra del
segundo proveedor de 15 engranajes obtuvo x 2 = 321 unidades y s2 = 15 unidades.
a) Considerando que las varianzas son iguales y con  = 0,05 ¿existe evidencia que
pruebe que los engranajes del segundo proveedor tienen mayor resistencia la
impacto?
b) ¿los datos apoyan la afirmación del segundo proveedor de que sus engranajes
tienen una resistencia de por lo menos 25 unidades más que los del primero?
c) ¿existe evidencia suficiente para concluir que la varianza de la resistencia al
impacto es diferente para los dos proveedores?
APÉNDICE V. BIBLIOGRAFIA
 ISO/TR 10017:2003 Guidance on statistical techniques for ISO 9001:2000
 ISO 9000:2000, Sistemas de Gestión de Calidad – Conceptos y vocabulario
 ISO 3534 Part I: 1993. Statistics -- Vocabulary and symbols -- Part 1:

Probability and general statistical terms
 MONTGOMERY, D. Control Estadístico de la Calidad, Edit. Iberoamericana, o

Ed. J. Wiley
 DUNCAN, A. Control de Calidad y Estadística Industrial, Ed. Alfa Omega
 MILLER, J. FREUND, J., Probabilidad y Estadística para Ingenieros, Ed.

Limusa
 MEYER, R. Probabilidad y aplicaciones estadísticas, Editorial Fondo

Educativo Americano.
 ENGINEERING STATISTICS, HANBOOK, Manual on-line de Ingeniería

Estadística publicado por el NIST, National Institute for Standards and
Technology, http://www.itl.nist.gov/div898/handbook/
 JURAN, Manual de Control de Calidad, versión en español de Mc Graw Hill.

Estadística Aplicada

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Estadística Aplicada

Caricato da

Copyright:

Formati disponibili

r

Universidad Tecnológica Nacional

PROBABILIDAD Y ESTADÍSTICA APLICADA

Motivación y Objetivos generales del módulo

El objetivo central de este curso es presentar los elementos estadísticos básicos

En este contexto, existen diversas herramientas y métodos estadísticos que ocupan un

Para mayor aclaración, a continuación especificamos con más detalle los

 Presentar las bases estadísticas de las principales herramientas usadas en la

 Dotar a los participantes de la formación necesaria para el empleo correcto

 Concebimos que las citadas herramientas deben poder ser aplicadas no

de cada empresa, de cada proceso o producto, y de cada situación. Por lo

 Para la correcta y fluida incorporación de dichos conceptos, recurriremos a

Diferencia con otros cursos de Estadística y Probabilidad

La aplicación de una herramienta estadística a situaciones reales comprende por lo

a) elegir la técnica o herramienta adecuada para cada

Sin embargo, es de notar que, por lo general, la bibliografía y los cursos de

La mayoría de las carreras universitarias, no solamente las carreras técnicas

A diferencia de ellos, este no es un curso teórico o “académico”. El título de este

otorgándole al alumno elementos que suponen una ventaja competitiva en sus

Trabajaremos, siempre que sea posible, con casos y ejemplos tomados de la

Metodología a utilizarse en el módulo

La metodología de enseñanza de este curso debe ser acorde a los objetivos

Se pretende abordar los problemas a partir de la experiencia concreta en el propio

Previamente al estudio de estos casos, será necesaria el repaso y/o profundización

programa. La recomendación de conocimientos mínimos de Excel significa sólo eso:

a) Introducción. Planteo del problema, aspectos a estudiar o mejorar, riesgos

EJERCICIOS A RESOLVER: En el Apéndice IV se presenta una lista de ejercicios,

CONDICIONES DE APROBACIÓN: Para aprobar el módulo, los alumnos deberán

CAP: I. INTRODUCCIÓN Y ESTADÍSTICA DESCRIPTIVA

Parte 1. LAS 10 PREGUNTAS INICIALES

1.¿Por qué estudiar Estadística Aplicada en un curso de posgrado en Calidad?

1.¿Por qué estudiar Estadística Aplicada en un curso de posgrado en Calidad?

“El uso de las técnicas estadísticas puede ser de ayuda para

La variabilidad puede observarse en el comportamiento y en los

Las técnicas estadísticas pueden ayudar a medir, describir,

dichos datos puede ayudar a proporcionar un mayor entendimiento de la

En el informe estadístico ISO/TR 10017 se proporcionan orientaciones

El citado documento,ISO/TR 10017:1999(E) Guidance on statistical techniques for

2.¿Cuáles son las aplicaciones principales?

“Sólo lo que puede medirse puede mejorarse” es una de las primeras

a) Estadística Descriptiva: Técnicas para describir, sintetizar y presentar datos

b) Inferencia Estadística: En este módulo veremos los conceptos principales. Inferir

c) Ensayos de aceptación por muestreo: El término muestreo significa métodos

d) Control Estadístico de Procesos: En el módulo del mismo nombre se

e) Confiabilidad: Es la aplicación de métodos estadísticos e ingenieriles para

f) Análisis de mediciones: (““Análisis del Sistema de Medición” en el contexto de la

3.¿Cómo fue, brevemente, la historia de los métodos estadísticos en Calidad?

Prontamente, estos métodos comenzaron a volverse excesivamente costosos y poco

En síntesis, podemos decir que la aplicación de la Estadística en la Calidad,

Antes de ver la respuesta a esta pregunta, intente

En general resulta imposible o impracticable la inspección de todos los elementos de

Se busca que la muestra sea lo más representativa posible de la población. Si

1.Expresar resultados numéricos en un contexto tal que se

El primero de ellos es evidentemente menos ambicioso que el segundo. Basta con

Fundamentalmente, las aplicaciones de la inferencia pueden clasificarse a dos

En este módulo veremos las bases de la Estadística Descriptiva e Inferencial,

6. ¿Cómo se aplican las técnicas estadísticas?

d) elegir la técnica o herramienta adecuada para cada aplicación,

Sin embargo, es de notar que en general la bibliografía y los cursos de capacitación

7. Qué desventaja y que ventaja, en general, tiene la aplicación de una

DESVENTAJA Ningún método estadístico es “100% seguro” No

8. ¿Cuál es el papel de los datos y de qué tipo son?

1. Datos nominales: Indican pertenencia a grupos o clases. Por ejemplo, si