Sei sulla pagina 1di 95

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA

INGENIERÍA EN INDUSTRIAS FORESTALES

HERRAMIENTAS ESTADISTICAS PARA


EL CONTROL DE PROCESOS

IIN
NGG.. E
EDDU
UAAR
RDDO
ODDIIA
AZZ LLIIC
C .. D
DAAN
NIIE
ELL R
RUUIIZZ
Pag
CONTENIDO
INTRODUCCION 1
CAPITULO I 3
CONTROL DE CALIDAD 3
Objetivos 3
Introducción 3
Conceptos de calidad 4
Control de calidad 5
Principios del Control de Calidad 7
Funciones del Control de Calidad 8
Costos de Calidad 10

CAPITULO II 15
MEJORAMIENTO CONTINUO E INNOVACIÓN 15
Investigaciones estadísticas 16
La Estadística en lo Analítico y en lo Enumerativo 17
Elementos Básicos sobre Variación 19
Clasificación de Procesos 22
El experimento de Deming 27
CAPITULO III.
LA TEORIA MUESTRAL
35
Necesidad de Muestreo
35
Tipos de Muestreo
36
Distribuciones Muestrales
37
1. Distribución muestral de medias
40
2. Distribución muestral para la diferencia de medias
41
3. Distribución muestral de proporciones y diferencias
47
4. Distribución muestral de varianzas
51
Tamaño de la muestra
54
56
61
CAPITULO IV
61
CONTROL ESTADISTICO DEL PROCESO
61
Objetivos
62
Introducción
62
Métodos Estadísticos
64
Cartas de control
75
Diagrama Causa-Efecto
76
Diagrama de Pareto
79
Gráfico de corridas
80
Histogramas de Frecuencia
81
Análisis de Regresión
Ajustes de Curvas
BIBLIOGRAFIA 94
INTRODUCCION

El presente trabajo representa un breve, general e introductorio tratado


sobre herramientas estadísticas aplicables al control de procesos, como un
material de apoyo dirigido a los gerentes.

Es de hacer notar que este papel de trabajo está sujeto a revisión y que
cualquier sugerencia al respecto será muy bien aceptada.

Así mismo, es conveniente señalar que los autores no pretenden reclamar


la autoría de algunos trabajos a los cuales se hace referencia, dado que los
mismos son productos de congresos, seminarios, lecturas, cursos y de su
experiencia profesional. De esta forma, lo original de este escrito consiste en
haberlos recopilados y en presentarlos de una forma resumida como una guía de
estudio.

Este texto difiere de las publicaciones comunes de estadística y/o control de


calidad porque su principal propósito es, además de conceptualizar el control de
calidad, mostrar cómo aplicar la teoría estadística a problemas derivados de la
experiencia del campo laboral. La estadística descriptiva, per sé no resuelve los
problemas de producción y los métodos estadísticos son herramientas que
ayudan a mejorar el proceso, dando objetividad a las observaciones y no servirían
si no son utilizados apropiadamente. De esta forma, se dará mayor importancia a
los hechos que a los conceptos abstractos, utilizando cifras derivadas de
observaciones reales, aceptando como confiable la información proveniente de la
distribución normal hacia la cual tiende las observaciones cuando son grandes.
Los métodos estadísticos constituyen un medio efectivo para controlar la
calidad en el proceso de producción; sin embargo, "lo importante no es el
conocimiento de los métodos estadísticos sino más bien la actitud mental hacia su
utilización",(Kume, 1992; p.9)).
CAPITULO I.

EL CONTROL DE LA CALIDAD

OBJETIVOS:

Conocer los conceptos básicos aplicados en el control de calidad y


familiarizar al lector con los principios, funciones y los costos que la calidad
implica.

INTRODUCCIÓN:

La finalidad de todo proceso industrial es la reproducción del prototipo de un


producto. Cuando el producto está bien diseñado y se fabrica cumpliendo las
normas establecidas, el mismo llenará las expectativas para el cual fue elaborado
y para el usuario. En consecuencia, se hace necesario que todos los productos se
fabriquen ajustados a las normas, el control de calidad interviene para asegurar el
fiel cumplimiento de estas normas por el producto.

Lógicamente no hay dos productos iguales, por lo que la calidad varía


continuamente, dependiendo del nivel de refinamiento técnico alcanzado.

Puesto que la calidad es variable, va en contraposición a la uniformidad y


en la práctica esta situación se obvia llegando a la transacción entre ambos,
estableciendo límites para definir las variaciones con respecto a las
especificaciones cualitativas permisibles y tolerables en el producto final, sin
desmedro del principio de normalización.
Sin embargo existen elementos perturbadores que impiden que la
producción se ajuste lo mejor posible a las especificaciones cualitativas, tales
como:
1.- Irregularidad en las máquinas
2.- Imprecisiones humanas
3.- Errores de los instrumentos de control
4.- Condiciones ambientales
5.- Otros

La desviación cualitativa del producto representa un aumento de los costos


puesto que implica un gasto extra de materia prima o de tiempo y trabajos para
realizar las correcciones de los defectos del producto acabado.

Este aumento de los costos de producción sumados a los retrasos de la


producción, la disminución del prestigio de la empresa, etc. son hechos graves
como para no estudiarlos atentamente y buscar las medidas correctivas
necesarias.

El diseño de este trabajo bibliográfico va orientado a proporcionar los


conocimientos mínimos necesarios que permitan comprender las técnicas
estadísticas, metodología e interpretación y análisis de resultados. Para ello es
necesario basarse en fundamentos de estadísticas matemáticas, así como en
matemáticas avanzadas; sin embargo, la mayoría de las aplicaciones descritas
sólo requieren de conocimientos aritméticos.

2.- CONCEPTO DE CALIDAD

Calidad es la aptitud de un producto para satisfacer una necesidad al menor


costo posible.
La calidad de un producto implica dos aspectos fundamentales:

a. Calidad del Diseño:

Es el grado de concordancia entre el diseño y el fin para el cual fue creado;


en la medida que las características previstas, los materiales y las formas
concebidas por el diseñador cumplen con las necesidades del usuario.

b. Calidad del Producto:

Es el grado de concordancia entre el producto y sus especificaciones.


Siendo el grado en el que el proceso de manufactura y mano de obra han
reproducido el producto lo más cercano del diseño original.

3.- CONTROL DE CALIDAD:

Es el proceso mediante el cual se miden las características de un producto,


se comparan los valores con las normas establecidas y se adoptan las medidas
correctivas convenientes cuando no se ajustan a las normas.

La definición previa de Calidad tiene varias implicaciones y una de ellas es


que con el sólo control estadístico no es posible alcanzar la satisfacción del
consumidor, por lo tanto para alcanzar esta calidad se requiere además:

1. Una adecuada investigación de mercado (calidad de investigación del


mercado).
2. Un producto con un diseño acorde (calidad de diseño).
3. Un producto fiel al diseño del prototipo (calidad de fabricación o
concordancia).
4. Un producto al alcance del consumidor oportunamente (calidad de
distribución).
5. Un producto con adecuados componentes de reemplazo (calidad de
servicio).

De esta forma la calidad es una resultante de todos estos elementos


mencionados, que para ser alcanzada requiere de un control total de la calidad.
Entre estos controles se pueden establecer (ver figura 1):

Control Dinámico de la Calidad:

Realizado estrictamente sobre el proceso de fabricación.

Control Estático de la Calidad:

Aplicado a los productos semi-elaborados y productos terminados.

ENTRADA PROCESO DE PRODUCTO


MATERIA FABRICACION FINAL
PRIMA

CONTROL
DINAMICO

CONTROL
ESTATICO

FIGURA 1.

GRAFICO DE LOS TIPOS DE CONTROL


PRINCIPIOS DEL CONTROL DE CALIDAD

1. Con el control de calidad no se obtiene calidad del producto; ésta es una


característica inherente al producto mismo. Esto es evidente, para
obtener un buen nivel de calidad hay que fabricarlo puesto que el control
de calidad no agrega calidad a los productos.

2. El equipo productor es el responsable directo de la calidad del producto


de acuerdo a las directrices que el control de calidad establece.

3. No resuelve problemas de fabricación, sólo da las razones para


estudiarlos. Es muy importante que el equipo productor sepa qué
problemas existen y en qué sentido se manifiestan para lograr un buen
nivel de calidad en la fabricación.

4. Las decisiones deben tomarse sobre la base de datos reales, la


confiabilidad de los datos registrados es el punto inicial para todo
análisis e interpretación de resultado.

5. Los datos deben ser compatibles y estar dispuestos de manera tal, que
permitan su análisis. Esto permitirá el empleo de algunas herramientas
estadísticas de las cuales el control de calidad hace uso.

6. El control de calidad debe ser activo, debe prevenir la ocurrencia de


errores o defectos, mantener regulados y bajo control los procesos,
evitar el desperdicio, el reproceso, las devoluciones y tomar las medidas
correctivas oportunamente.
FUNCIONES DEL CONTROL DE CALIDAD:

Antes de iniciar la fabricación de un producto, se requiere fijar las


especificaciones de lo que se va a hacer. Después, viene la manufactura real de
este producto y finalmente la comprobación para verificar si está de acuerdo con
lo especificado. Al pensar en todos los puntos relacionados con la calidad es
conveniente hacerlo en término de estas tres funciones: Especificación,
fabricación e inspección.

El control de calidad estadístico debe ser considerado como un grupo de


herramientas, que pueden influir en las decisiones relacionadas con estas
funciones. Mientras más personas existan en cargos de supervisión de inspección,
de supervisión de producción, de ingeniería de métodos, de ingeniería de diseño y
de nivel gerencial, que comprendan los principios básicos de control de calidad
estadístico, mayor será la probabilidad de emplear efectivamente estas técnicas
en una organización.

Entre las funciones básicas del control de calidad relacionadas con las
funciones de especificar, fabricar e inspeccionar un producto tenemos:

1. Intervenir en la estipulación de la calidad de diseño mediante la


realización de normas de control, preparación de prescripciones etc.
Esta no es una función exclusiva de control de calidad, pues intervienen
otros departamentos, pero jamás debe realizarse un diseño sin la
intervención del departamento de control de calidad.

2. Ejercer el control dinámico de la calidad mediante el control durante el


proceso de fabricación, con el propósito de obtener productos de
acuerdo al diseño, evitando la fabricación de piezas defectuosas.
3. Ejercer el control estático de la calidad mediante el establecimiento del
control de entrada y de salida con el propósito de vigilar el producto
terminado o la materia prima para otros sectores de la planta.

TAREAS ESPECIFICAS DE UN PROGRAMA DE CONTROL DE CALIDAD


A continuación figuran tareas específicas que pueden cumplirse como parte
de un programa de control de calidad.
a. Determinar las condiciones que deben cumplir los diseños, los proyectos
y las especificaciones para satisfacer las normas de calidad y a su vez
verificar que se cumplan los procedimientos establecidos.

b. Planificar las herramientas, los instrumentos de medición y el equipo de


control necesario para medir las características del producto. Así mismo
verificar que los instrumentos de medición estén calibrados.

c. Establecer procedimientos de control de calidad, basados en la


estadística sobre las operaciones de fabricación, así como para las
piezas, materiales y muestreos de recepción.

d. Crear un sistema para inscribir en un registro los defectos en materia de


calidad y para inscribir datos sobre seguimiento de las medidas
correctoras adoptadas, igualmente recoger las informaciones que
puedan proporcionar mejoras al proceso de fabricación.

e. Proporcionar formación para el personal de inspección, de pruebas, etc.

f. Establecer los costos de control de calidad.


COSTOS DE CALIDAD
Cada uno de los departamentos de una organización debe ser capaz de
justificar su existencia midiendo sus costos y comparándolos con la contribución
que aporta al cumplimiento de los objetivos de la compañía y a la obtención de
beneficios. El departamento de control de calidad no es una excepción. Por
consiguiente, es importante determinar el costo general del control de calidad.

Mejorar el nivel de calidad de un producto hace que el costo de producción


del mismo se eleve, lógicamente se convierte en un aspecto que debe ser
estudiado detenidamente. En la práctica siempre hay un nivel de rechazos óptimo
para un proceso dado, por lo que carece de sentido esforzarse por reducir los
rechazos. Por lo tanto la calidad de un producto debe ser controlada a una
tolerancia dada y para cierto nivel de rechazos, para obtener la relación de
compromiso requerida, pretender mejorar la calidad más allá de este nivel es,
hacer la producción anti-económica. El costo total del control de calidad bien
puede ser analizado o determinado, agrupando los costos en cuatro categorías
(ver figura 2)

CATEGORIAS
DE COSTOS
DE CALIDAD

COSTO COSTO DEFECTOS DEFECTOS


DE DE DENTRO FUERA
PREVENCION EVALUACION DE LA DE LA
ORGANIZACION ORGANIZACION

Figura 2: CATEGORIAS DE COSTOS DE CALIDAD


1. Prevención.- Los costos de prevención son los de planificación y
aplicación del programa de calidad antes de la fabricación del producto. A
continuación se dan ejemplos de tareas que pueden clasificarse como de
prevención de defectos.

a) Revisión del diseño.

b) Programas de formación y titularización de trabajadores.

c) Calificación de proveedores antes de la subcontratación.

d) Medios mecánicos para el control de calidad, incluido el diseño de


equipos y herramientas especiales.

e) Control de los procesos para asegurar que los procesos de fabricación


corresponden a las tolerancias establecidas para el producto.

2. Costo de evaluación. Los costos de evaluación son los gastos en que


se incurre para medir la conformidad del producto con las normas; incluidas las
inspecciones y pruebas.

A continuación se dan ejemplos de tareas cuyo costo puede incluirse en


esta categoría:

a) Inspección y prueba de las piezas y materiales suministrados por


proveedores.
b) Inspección y prueba de materiales, piezas, montajes parciales o
productos completos fabricados en la empresa.
c) Costo de los productos destruidos o dañados para realizar pruebas
que destruyen en material o determinan su período de vida.
d) Calibración y conservación de instrumentos y equipos de medición.
e) Compilación, registro y comunicación de datos sobre cuestiones de
calidad.

3. Defectos dentro de la organización.- Los defectos dentro de la


organización son aquellos que se producen antes de la expedición (o mientras el
producto sigue perteneciendo a la compañía productora). Estos costos son el
resultado de productos defectuosos (productos que no cumplen las normas).
Entran en esta categoría los costos siguientes:

a) Sustitución de piezas defectuosas.


b) Costos de reparación.
c) Costos de recepción y trámite de las quejas.
d) Responsabilidad del fabricante por los peligros que puede suponer el
producto, generalmente en forma de litigios o costo del seguro de
responsabilidad civil.
e) Pérdida de pedidos futuros o daño para la reputación de la empresa por
los defectos comprados por los clientes.

4.-Defectos fuera de la organización: Se incluyen en esta categoría los


costos relacionados con los defectos que se revelan una vez que el producto es
propiedad del cliente. Se incluyen los siguientes costos:

a) Sustitución de piezas defectuosas.


b) Costos de reparación.
c) Costos de recepción y trámites de reclamos.
d) Costos legales y/o seguros.
e) Pérdida de futuros pedidos y daños a la reputación de la empresa.
Los costos de prevención y evaluación constituyen los costos directos del
control de calidad. Por otra parte tenemos a los costos por defectos, tanto dentro
como fuera de la organización, que serían los costos indirectos. (ver figura 3). A
medida que los costos directos se reducen, aumenta el número de defectos y a
medida que aumenta el nivel de éstos, aumenta el costo por defectos.

Los costos totales del control de calidad son la suma de los costos directos
y de los costos por defectos o costos indirectos. En el valor mínimo de la curva de
costos totales, se sitúa la combinación óptima de esfuerzos.

COSTOS POR CONCEPTO


DE CALIDAD

COSTOS TOTALES

COSTOS
INDIRECTOS

COSTOS DIRECTOS

AUMENTO DE DEFECTOS

NIVEL DE DEFECTOS DEL PRODUCTO

FIGURA 3. INCIDENCIA DE LOS COSTOS SOBRE LA CALIDAD.


El control de la calidad debe efectuarse sin perder de vista los costos que
implica y los beneficios que de su aplicación se deriven. Generalmente el control
total de la calidad conduce a una reducción paulatina de los costos totales de la
calidad en una empresa haciendo énfasis en la prevención de la ocurrencia de
defectos más que en cualquier otro caso.

Los costos de prevención representan el 5% del costo total de la calidad, en


contraste con los costos por fallas, los cuales alcanzan entre el 70 y 80%
aproximadamente. Los costos de inspección representan entre el 15 y 25%.
CAPITULO II

CALIDAD TOTAL.
MEJORAMIENTO CONTINUO E INNOVACIÓN

El quinto de los 14 postulados de Deming, también conocido como el padre


del concepto de calidad total, aboga por la mejoría constante y continua de todos
los procesos de planificación, producción y servicio. El mejoramiento continuo
disminuye el desperdicio, disminuye costos y aumenta la productividad y crea
condiciones para el disfrute del trabajo.

Mejorar continuamente e innovar en las organizaciones de las que


formamos parte, es contribuir a la construcción de un mundo mejor.

ESTADISTICA SEGÚN FEDERER (1973).

Es la ciencia que se ocupa de la caracterización, el desarrollo y la


aplicación de técnicas para:

1. El diseño estadístico de una investigación, bien sea un experimento


comparativo, una encuesta por muestreo, un estudio de observación o
un estudio de construcción de un modelo estocástico.
2. El resumen de los hechos de investigación
3. Las inferencias que se pueden formular a partir de los hechos de la
investigación, sobre la población bajo estudio.
INVESTIGACIONES ESTADÍSTICAS.

Los estudios estadísticos de carácter empírico se pueden clasificar de


acuerdo a la finalidad que persiguen en dos tipos:

Estudios Enumerativos: Aquellos en los cuales se estudia un marco


específico con la finalidad de actuar sobre los elementos que lo conforman.
(Inferencia Estadística).

Estudios Analíticos: Aquellos en los cuales el objetivo es actuar sobre el


sistema de causas o proceso que produjo los elementos del marco estudiado.
(Diseño Estadístico).

La figura que se presenta en la página siguiente ilustra este proceso


UNIVERSO

MARCO
Unidad nos interesamos en Características
X, Y, . . ., Z

SISTEMA DE CAUSAS
Cuya medición u
observación genera:

Población de valores
Observados o medidos
De la característica
Población ... X

Multivariante ó Y
(X,Y,...,Z) ...

Z
Procesos y características de calidad.

SISTEMA
Red interdependiente de componentes que actúan
conjuntamente para lograr el fin del sistema

Actividad de la organización
Proceso Donde se identifican:
A 1) Entradas

2) Actividades de
Proceso B transformación y
3) Salidas
Característica X
.
.
Característica Z

Proceso
K

Propiedades de las entradas, actividades de transformación


y salidas que otorgan a estas carácter distintivo

Esquema de un proceso.

E (entradas) Proceso S (Salidas)


P Personas
Personas
Métodos Métodos
Ambiente Ambiente
Equipos Equipos
Servicios Servicios
Materiales Materiales
VARIACION.

Fenómeno que se manifiesta en la incapacidad de un sistema, proceso,


persona, etc. para reproducir exactamente un comportamiento dado, aún bajo
condiciones aparentemente semejantes.

ELEMENTOS BASICOS SOBRE VARIACION. ( Joiner & Gaudard).

• La variación es causal
• Hay distintos tipos de variación
• La eliminación o atenuación de cada tipo de causa demanda de acciones
radicalmente distintas
• Un sistema es estable cuando solo obedece a causas comunes
• La cantidad de variación se puede medir estadísticamente

Causas comunes:

• Multitud de factores que siempre están presentes y que contribuyen en


diversos grados a cambios pequeños y aparentemente aleatorios en el
resultado de un proceso.
• Su agregación resulta en lo que podemos denominar la variación del
sistema.

Causas especiales:

• Factores que actúan esporádicamente sobre el sistema agregando


variación adicional sobre la variación del sistema.
• Manifestaciones extremas
• Causas asignables.
Causas distintas requieren acciones Distintas.

• Asunto crítico
• La diferencia más importante es entre causas comunes y causas especiales
• Estrategia para eliminar causas especiales:
- Obtener datos oportunos
- Prestar atención a señales de posibles causas especiales
- Investigar su origen
- Tomar previsiones para que lo malo no recurra
- Tomar previsiones para que lo bueno siga ocurriendo
• Estrategia para mejorar un sistema de causas comunes:
- Todos los datos son importantes
- Conocimiento íntimo del sistema

Interferencias Innecesarias.

• Ajustes innecesarios efectuados para compensar o “corregir” la variación


del sistema y que agregan más variación. (ver experimento de Deming).
• Exacerbar en lugar de mejorar
• Tratar todo como si fuera el resultado de causas especiales (querer explicar
todo)
• Errores comunes:
- Examinar las últimas cifras
- Suponer que todo lo bueno o malo se debe a la actuación de las personas

Los gráficos y figuras que se muestran a continuación ilustran estos


procedimientos:
OTRA VISUALIZACIÓN DEL MEJORAMIENTO
NIVEL Y / O VARIABILIDAD
CLASIFICACION DE PROCESOS

1. Estado Ideal. Proceso bajo control Estadístico y Producción conforme al


100%.

2. Estado de Caos. Proceso fuera de control Estadístico y Producción


conforme menor del 100%.
4. Próximo al Estado del Caos. Proceso fuera del Control Estadístico y
producción conforme al 100%

5. Próximo al Estado Ideal. Proceso bajo control Estadístico y producción


Conforme menor del 100%.
Experimento de Deming.

“ Una función de los métodos estadísticos es la de diseñar

experimentos y utilizar la experiencia relevante de forma que

resulte eficaz. Cualquier intento de utilizar la experiencia

relevante sin un plan que se base en la teoría, es disfrazar la

racionalización de una decisión que ya ha sido tomada.1

EXPERIMENTO DE SIMULACIÓN

Zk
0
Posición de la esfera,
Blanco resultante en el lanzamiento
X
K esimo

1
Deming. Fuera de la crisis. 1984. p. 312
Reglas para ajustar el embudo.
Se pretende que al dejar caer la esfera a través del embudo, coincida
con el blanco

Regla No. 1.- Mantener el embudo fijo apuntando al blanco en

todos los lanzamientos.

Regla No. 2.- Desplazar el embudo a una distancia – z k de su

última posición para el lanzamiento (k + 1).

Regla No. 3.- Desplazar el embudo a una distancia – z k del

blanco para el lanzamiento (k + 1) ésimo.

Regla No. 4.- Colocar el embudo sobre la posición que ocupó

La esfera en el último lanzamiento.

En las próximas páginas se observa el efecto gráficamente.


CAPITULO III.

TEORIA MUESTRAL

La teoría de muestreo se refiere al estudio de las relaciones que existen


entre un colectivo o población y las muestras que se extraen de las mismas. El
estudio de las muestras permite hacer estimaciones de características
desconocidas de la población (tales como media, desviación típica, proporciones,
etc). Estas estimaciones se hacen a partir del conocimiento de las características
de las muestras (media, desviación típica, proporción, etc).

Las características o medidas obtenidas de una muestra se llaman


estadísticos; y las medidas correspondientes a la población parámetros. Cuando
una medida muestral o estadístico es utilizada como representante de una
característica poblacional o parámetro se denomina estimador.

Ventajas de la utilización de las muestras

1) El costo es menor y se puede obtener un mejor rendimiento del dinero


invertido.
2) Se obtiene una disminución notable del tiempo necesario para alcanzar la
información

Cuando una muestra posee 30 o más datos se denomina grandes muestras y


si la muestra tiene menos de 30 observaciones se denomina pequeñas
muestras.
Se denomina muestreo al procedimiento utilizado para elegir una muestra

Necesidad del Muestreo.


1. Población Infinita
2. Población uniforme
3. Proceso de investigación destructiva
4. Economía de costos
5. Calidad
Muestreo con o sin reemplazamiento:
• Con reemplazamiento cuando un elemento de la población puede ser
escogido varias veces para formar parte de la muestra
• Sin reemplazamiento cuando un elemento de la población solo puede
ser seleccionado una sola vez para formar parte de la muestra.

Población: es una colección de todos los elementos que estamos


estudiando y acerca de los cuales se intenta extraer conclusiones. Puede ser
infinita o finita.

Muestra: Una parte de la población o un subconjunto del conjunto de


unidades obtenidas con el objeto de investigar las propiedades de la población.

Muestreo estadístico: Es un enfoque sistemático para seleccionar unos


cuantos elementos (una muestra) de un grupo de datos (población) a fin de
hacer algunas inferencias sobre el grupo total. Desde el punto de vista
matemático, podemos describir las muestras y las poblaciones mediante
medidas como la media, la moda, la desviación estándar, etc. No es mas que
el procedimiento a través del cual se obtienen las muestras.
Tipos de muestreo

Muestreo de juicio o no probabilístico. (opinático). Se basa en el


conocimiento de la población por parte de alguien, quien hace a la muestra
representativa, dependiendo de su intención, por lo tanto es subjetiva.

Probabilístico (Errático): Todos los elementos de la población tienen la


posibilidad de pertenecer a la muestra.

Muestreo Aleatorio:
1. Muestreo aleatorio simple
2. Muestreo Sistemático.
3. Muestreo Estratificado
4. Muestreo por Conglomerado

Muestreo de juicio: A través del conocimiento y la opinión personal,


basada en la experiencia del investigador, se identifican los elementos de la
población que van a formar parte de la muestra. Una muestra seleccionada por
muestreo de juicio se basa en el conocimiento de la población por parte de
alguien. Por ejemplo, un guardabosques tomará una muestra de juicio si decide
con antelación que parte de una gran zona reforestada deberá recorrer para
estimar el total de metros de madera que pueden cortarse. En ocasiones el
muestreo de juicio sirve de muestra piloto para decidir cómo seleccionar después
una muestra aleatoria.

Muestreo aleatorio: Cuando se conoce la probabilidad de que un


elemento de la población figure o no en la muestra, puede ser:
Muestreo Aleatorio Simple (Irrestrictamente Aleatorio):
Un muestreo es aleatorio cuando cada elemento de la población tiene la
misma probabilidad de ser escogido para formar parte de la muestra. Este tipo de
muestreo evita que la muestra sea sesgada evitando por lo tanto que se realice
una mala inferencia estadística. Por ejemplo, supóngase que un investigador
quiera estimar el módulo de ruptura promedio de un material determinado
formado por una población de tamaño

N = 500; por ser ensayos destructivos este quiere seleccionar una muestra
de tamaño

n = 10 que le permita realizar la inferencia, ahora bien el criterio que usó el


investigador para seleccionar dicha muestra fue el de tomar 10 materiales
que estaban más próximos a él; evidentemente esta muestra no es
representativa de la población, se dice que esta sesgada, por lo que la
inferencia estadística que se realice será errónea. Por lo tanto, una muestra
se dice que esta sesgada cuando los elementos seleccionados tenían
mayor probabilidad de pertenecer a la misma.

La forma más fácil de realizarlo es usando números aleatorios, para esto se


puede recurrir a una tabla o a un generador de números aleatorios. Actualmente,
se recurre a computadora.

Muestreo Sistemático o Secuencial.


Los elementos se seleccionan de la población con un intervalo uniforme en
el tiempo, en el orden o en el espacio. Por ejemplo, supongamos que se quiere
estudiar una determinada característica de un producto fabricado en serie y se
decide seleccionar a cada veinte producto hasta formar la muestra, para esto se
escoge un punto aleatorio de arranque en los primeros veinte productos y luego se
escoge cada vigésimo producto hasta completar la muestra. Una de las ventajas
de este muestreo es cuando los elementos presentan un patrón secuencial, tal vez
requiera menos tiempo y algunas veces cuesta menos que el método de muestreo
aleatorio.

Muestreo Estratificado.
Para aplicar el muestreo estratificado, se divide la población en grupos
homogéneos, llamados estratos, los cuales son heterógeneos entre si. Después
se recurre a uno de dos métodos posibles:

a) Se selecciona al azar en cada estrato un número especificado


de elementos correspondientes a la proporción del estrato de la población
total
b) Se extrae al azar un número igual de elementos de cada
estrato y damos un peso a los resultados de acuerdo a la proporción del
estrato en la población total

El muestreo estratificado es adecuado cuando la población ya está dividida


en grupos de diferentes tamaños y queremos reconocer este hecho. La ventaja de
las muestras estratificadas, es que cuando se diseñan bien, reflejan más
exactamente las características de la población de donde se extrajeron que otras
clases de muestreo.

Muestreo por Conglomerado.


En el muestreo por conglomerados, se divide la población en grupos o
conglomerados de elementos heterogéneos, pero homogéneos con respecto a los
grupos entre si. Un procedimiento bien diseñado, de muestreo por conglomerados,
puede producir una muestra más precisa a un costo mucho menor que el de un
simple muestreo aleatorio. Se usa el muestreo estratificado cuando cada grupo
presenta una pequeña variación en su interior, pero existe una amplia variación
entre ellos. Se usa el muestreo por conglomerado en el caso contrario, cuando
hay considerable variación dentro de cada grupo pero los grupos son
esencialmente semejantes entre sí.

DISTRIBUCIONES MUESTRALES

1 Distribución muestral de medias


2 Distribución muestral para diferencias de medias
3 Distribución muestral de proporciones y diferencias
4 Distribución muestral de varianzas

Se define la distribución muestral de un estadístico (distribución de


muestreo) en una población, como la distribución de probabilidad de todos los
posibles valores que un estadístico puede asumir para cierto tamaño de la
muestra. Específicamente, se trabajará con las distribuciones muestrales para:
medias, proporciones y varianzas.

Una distribución muestral es una distribución de probabilidad de un


estadístico muestral calculado a partir de todas las muestras posibles de tamaño
n, elegidas al azar en una población determinada. Si la población es infinita,
tenemos que concebir la distribución muestral como una distribución muestral
teórica, ya que es imposible sacar todas las muestras aleatorias posibles de
tamaño n de una población infinita. Si la población es finita y moderada se puede
construir una distribución muestral experimental, sacando todas las muestras
posibles de un tamaño dado, calculando para cada muestra el valor del estadístico
que nos interesa. Ejemplo, supongamos que se tiene una población de tamaño N
= 10 y queremos extraer con reemplazamiento todas las muestras posibles de
tamaño n = 5, para esto se utiliza la relación Nn , es decir,

105 = 100000 muestras de tamaño n = 5.


En cambio, si el muestreo es sin reemplazamiento, el número de muestras de
tamaño n = 5 viene dado por la combinatoria:

 N N! 10! 10.9.8.7.6.5!
  = = = = 252
n  n!(N − n)! 5!(10−5)1 5!.5.4.3.2.1 muestras.

En el caso anterior la distribución muestral para un estadístico determinado, la


v
media aritmética ( X )viena dada por:

muestra 1 → X1
muestra 2 → X2
:
M
muestra 252 → X 252

Por lo tanto, X1 , X 2 , X 3 , K , X 252 conforman la distibución muestral de medias.

Se puede hacer una aproximación experimental de distribuciones


muestrales basadas en poblaciones infinitas o finitas grandes, sacando un número
de muestras aleatorias y siguiendo el mismo procedimiento anterior.

1) DISTRIBUCIÓN MUESTRAL DE MEDIAS:


Es la distribución de probabilidad de todas las medias posibles de las
muestras, para un tamaño n determinado. Ver ejemplo, anterior. Esta distribución
de probabilidad tiene asociados (parámetros) tales como la media µ X y
desviación estándar σ X . Para calcular, estos parámetros de la distribución

muestral de medias se utilizan las siguientes relaciones:

µX = µ
σ N −n
σX = para poblaciones finitas
n N − 1

σ
σX = para poblaciones infinitas
n

La expresión

σ
σ X
=
n
Es la desviación estándar de la distribución muestral de medias, se le llama
error típico o estándar de la media y nos indica la diferencia promedio entre los
diversos valores de X y µ . Como se observa, a medida que el tamaño de la
muestra aumenta este error disminuye, las diversas medias muestrales se hacen
más uniforme en su valor, y en consecuencia, cualquier media muestral es una
buena estimación de la media poblacional µ.

Anteriormente se mostró la manera de calcular la media y la desviación


estándar de la distribución de las medias muestrales. Ahora se va a distinguir dos
situaciones:

a) Muestreo en una población distribuida normalmente: Si X es la


media de la muestra aleatoria de tamaño n, tomada de una población distribuida
σ
rmalmente, con media µ y desviación típica , entonces la distribución
n
muestral de X está normalmente distribuida. Para hallar la probabilidad asociada
a X , se transforman los valores de X a valores de la distribución normal
estandarizada, mediante la fórmula:

X-µ
Z=
σ/ n

Ejemplo: Cierta marca de neumáticos tiene una vida útil media de 21.000
Km con una desviación típica de 800 Km.

a. suponiendo que las vida útil de los neumáticos están distribuidas


normalmente. ¿Cuál es la probabilidad de que un neumático cualquiera
dure menos de 20.900 Km?

b. ¿Cuál es la probabilidad de que la vida útil media de 64 neumáticos sea


inferior a 20.900 Km?

Solución:
1. Como la variable X = vida útil de los neumáticos, está distribuida normalmente.
Entonces la probabilidad de que un neumático cualquiera dure menos de
20.900 km se calcula de la forma siguiente:
Estandarización

20.900 21.000 -0,13 0

 20.900 − 21.000 
P ( X ≤ 20.900) = P Z ≤  = P(Z ≤ −0,13) =0,4483
 800 

Es decir, el porcentaje de que un neumático tenga una vida útil menor que 20.900
Km es de 44,83 %.

Para calcular esta probabilidad, se recurre a una tabla de distribución normal


estandarizada.

2. Si se seleccionan todas las muestras posibles de tamaño 64 de la población de


neumáticos, entonces por lo anteriormente mencionado esta distribución muestral
de medias es normal, con media y desviación típica igual a 21.000 Km y 100 Km
respectivamente.
Luego la probabilidad de que la vida útil media de 64 neumáticos sea inferior a
20.900 Km se calcula de la forma siguiente:

 20.900 − 21.000 
P ( X ≤ 20.900) = P Z ≤  = P(Z ≤ −1) = 0,1587
 800 / 64 

Por lo que el porcentaje de que la vida útil media de 64 neumáticos sea inferior a
20.900 Km es de 15,87 %.
b) Distribución en poblaciones que no están distribuidas normalmente.
Existen métodos que se pueden emplear cuando se necesita hacer inferencia
sobre este tipo de población. Una solución usada con frecuencia es que se
extraiga una muestra grande. Una vez extraído ese n grande, el investigador
puede utilizar el Teorema del Límite Central, el cual se enuncia a
continuación:

“sin tomar en cuenta la forma funcional de la población de donde se


extrae la muestra, la distribución de medias muestrales, calculadas con
muestras de tamaño n extraídas de una población con media µ y
desviación estándar σ, se aproxima a una distribución normal con media
µ y desviación σ / n , cuando n aumenta. Si n es grande, la distribución
de las medias muestrales puede aproximarse mucho a una distribución
normal”.

Este teorema expresa que sin tomar en cuenta la forma de la población que se
está estudiando, se puede seguir empleando la teoría normal para obtener
inferencias sobre la media poblacional a condición de que obtengamos una
muestra grande, porque la distribución muestral de X será aproximadamente
normal cuando n sea grande. Generalmente, muchos investigadores consideran
que a partir de n = 30 se puede usar el teorema del Límite Central.

Ejemplo:
Una empresa emplea 1500 personas. La cantidad promedio gastada
durante un año determinado, en servicios médicos personales por empleados fue
de 25,75 $ y la desviación estándar de 5,25 $. ¿Cuál es la probabilidad de que
una muestra de 100 empleados arroje una media comprendida entre 25 y 27 $?.
En este problema no se específica si la población es normal, pero como el tamaño
de la muestra n = 100 > 30 podemos aplicar el teorema del límite central, por lo
que la distribución muestral de X es aproximadamente normal y por lo tanto
podemos hallar su probabilidad, esto es:

 25 − 25,75 27 − 25,75 
P (25 ≤ X ≤ 27) = P ≤Z≤  = P(− 1,48 ≤ Z ≤ 2,46 ) =0.9237
 5, 25 / 100 5, 25 / 100 

Es decir, se tiene un porcentaje del 92,37 % de que el promedio de gastos


médicos por empleado durante un año este entre 25 y 27 $.
está distribuido según la distribución t de Student con v = n1 + n2 –2 grados de
libertad.

c) Distribución t de student:

Esta distribución permite realizar inferencias sobre medias poblacionales


cuando se desconoce la varianza de la población con muestras de tamaño n < 30.
En consecuencia para hallar la probabilidad asociada a t transformamos los
valores t (de la distribución normal) a valores de la distribución normal
estandarizada mediante la siguiente fórmula:

X-µ
t=
S/ n

Para hallar la probabilidad asociada a t se usa la tabla de distribución de


Student.

Características de la distribución t:

a) tiene forma de campana como la distribución normal, solo que es


más ancha en las colas (mayor área)
b) los grados de libetad vienen dados por: v = n-1

c) Se aproxima a la normal a medida que aumentan los grados de


libertad.

Ejemplo: Considerando el ejemplo anterior, con µ = 25, 75 $ y σ


desconocida. ¿Cuál es la probabilidad de que una muestra de 20 empleados, con
una desviación de 5 $, arroje una media comprendida entre 25 y 27 $ ?.

Solución: Como n < 30 y σ es desconocida, se tienen pequeñas


muestras, por lo que se utiliza la distribución t de Student:

 
 
25 − 25,75 X − µ 27 − 25,75 
P (25 ≤ X ≤ 27) = P  ≤ ≤ = P(− 1,12 ≤ t ≤ 1,12 ) = 0,72
 5 / 20 S 5 / 20 
 
 n 

Es decir, se tiene una probabilidad de 0,72 (72 %) de que la media de gastos


médicos por empleado para una muestra de tamaño n = 20 está entre 25 y 27 $.

2) DISTRIBUCIÓN MUESTRAL PARA LA DIFERENCIA DE MEDIAS

( X 1 − X 2 ).-

A veces interesa hacer inferencias sobre la diferencia poblacional de


medias µ1 - µ2, o saber si es razonable concluir que dos medias poblacionales no
son iguales, considerando que se tienen sendas muestras para las poblaciones 1
y 2, respectivamente, donde:

Entonces, la diferencia de las medias muestrales X 1 − X 2 , estima a µ1 -

µ2. La forma funcional de la distribución muestral de X 1 − X 2 depende de la forma


funcional de las poblaciones donde se extraen las muestras tomando en cuenta:

• Si ambas poblaciones son normales la distribución muestral de la


diferencia de medias es normal.

• Si una o ambas de las poblaciones no es normal, la distribución


muestral de las diferencias de medias X 1 − X 2 es normal si n1 +
n2 – 2 >30 (grandes muestras), este resultado se deduce del
teorema del límite central.
En estos casos, los parámetros que definen esta distribución muestral de las
diferencias de medias vienen dados por:

µ X − X = µ1 − µ 2
1 2

σ 12 σ 2 2
σ X −X = +
1
n1 n2

El cual se aplica para dos casos específicos dependiendo de la muestra:


a) Para grandes muestras, cuando v = n1+n2 - 2 > 30, se trabaja con la
distribución normal. En estos casos, estandarizando la diferencia de
medias muestrales, se tiene:
( X 1 − X 2 ) − ( µ1 − µ 2 )
Z=
σ 12 σ 2 2
+
n1 n2

Ejemplo: La siguiente tabla nos muestra información del tiempo medio en


minutos que tarda un cliente en ser atendido en dos bancos:

Banco A Banco B
σ A2 = 3 min σ B2 = 5 min
µ A = 14 min µ B = 13 min
n A = 20 nB = 13

Hallar la probabilidad de que la diferencia media entre los dos bancos no


exceda de 2 minutos.

Solución: como los grados de libertad 20 + 13 –2 =33 – 2=31 > 30, se


tienen grandes muestras se trabaja con la distribución normal:

 
 
 ( X A − X B ) − (µ A − µB ) 2 − (µ A − µ B )   1 
P ( X A − X B ≤ 2) = P ≤  = P Z ≤  = P(Z ≤ 1,37) =
 σ A2 σ B2 3 5   0,73 
+ +
 n n 20 13 
 A B

0, 9146

Existe un 91,46 % que la diferencia media entre los dos bancos no exceda de 2
minutos.
b) Para pequeñas muestras, Cuando v = n1 + n2 –2 < 30, se trabaja con la
Distribución t de Student. Por lo tanto, el valor viene dado por:

( X 1 − X 2 ) − ( µ1 − µ 2 )
t=
2 2
Sp Sp
+
n1 n2

donde:

2 2
2 (n − 1) S1 + (n 2 − 1) S 2
Sp = 1
n1 + n 2 − 2

Ejemplo: Considerando los ingresos mensuales de empleados de dos empresas,


se tiene información de dos muestras mediante la siguiente tabla:

Empresa 1 Empresa 2
S12 = 400000000 Bs S 22 = 342250000 Bs
µ1 = 180000 Bs µ 2 = 210000 Bs
n1 = 20 n 2 = 10

Hallar la probabilidad de que la diferencia de medias muestrales sea a lo menos


3500.
Solución: : como los grados de libertad 20 + 10 –2 =30 – 2=28 < 30, se
tienen pequeñas muestras se trabaja con la distribución t de Student:

 
 
 ( X − X ) − (µ − µ ) 3500 + 30000   33500 
P ( X 1 − X 2 ≥ 3500) = P A B 1 2
≥  = P t ≥  = P(t ≥ 4,43)
 2
Sp Sp 2
381437500 381437500   7564,10 
 + + 
n1 n2 20 10
 

19..400000000 + 9.342250000
donde S p2 = = 381437500
28

Entonces para v = 28 gl y usando la tabla t de Student:

P ( Xˆ 1 − Xˆ 2 ≥ 3500) = P(t ≥ 4,43) = 0,99

Es decir, la probabilidad de que la diferencia media de los salarios sea mayor que
3500 es del 0,99.

)
3). DISTRIBUCIÓN DE UNA PROPORCION MUESTRAL ( P ).-
Se define una proporción poblacional como el cociente:

número de casos favorables


p=
total de casos

Por ejemplo: si de una población de N = 50, empleados de una empresa, 15


de ellos no cumplen con su horario de trabajo, la proporción de empleados que no
cumplen horario con relación al total, viene dado:
P = 15/50 = 0,3; es decir, el 30 % de los empleados no cumplen su horario.

La proporción muestral ( p̂ ), se define como:

número de casos favorables


p̂ =
tamaño de la muestra

Ejemplo:
Si se toma una muestra aleatoria de tamaño n = 1000 y 425 personas
satisfacen un evento, entonces p = 425 / 1000 = 0,425. Esto significa que el 42,5
% de las personas satisfacen dicho evento.
La distribución de una proporción muestral, se define de una manera
análoga a a la distribución de media, o sea:
Muestra 1---- p̂1
Muestra 2---- p̂2
Muestra 3---- p̂3

Muestra X---- p̂ k
De esta forma: p̂1 , p̂2 , p̂3 ,..., p̂ k corresponden a la distribución de una

proporción muestral.

De acuerdo a lo expuesto, la distribución muestral de proporciones


corresponde a una distribución de probabilidad de todas las proporciones posibles
de las muestras, para un tamaño n determinado.

Los parámetros que definen esta distribución vienen dados por:


µ pˆ = µ p = P
p.q N −n
σX = para poblacione s finitas
n N −1

p.q
σX = para poblacione s infinitas
n

Para el cálculo de probabilidades relativa a proporciones, se trabaja de


manera análoga al caso de la distribución muestral de medias.

Ejemplo: Un encuestador sabe que en cierta área el 20 % está a favor de


las emisiones en bonos. Considerando una muestra de 64 personas, hallar la
probabilidad de que la proporción muestral difiera de la proporción real a lo sumo
en un 0,06.

Solución:
p = 0.20 proporción de personas de la población que están a favor de la emisión
p̂ = proporción de personas de la muestra que están a favor de la emisión

entonces nos están pidiendo la siguiente probabilidad:

 
 
0,06 pˆ − p 0,06 
P ( pˆ − p ≤ 0,06) = P − ≤ ≤ = P(− 0,27 ≤ Z ≤ 0,27 ) = 0,20 4
 0,2.0,8 p.q 0,2.0,8 
 
 64 n 64 

4) DISTRIBUCIÓN MUESTRAL DE VARIANZAS.


Con esta distribución, se estudia las probabilidades relativas a la varianza
de una población. De esta forma, la distribución muestral de varianzas, viene dada
por todas las posibles varianzas de las muestras para un tamaño de muestra n
determinado. Para encontrar probabilidades relativas a varianzas se usa la
distribución χ2 (chi cuadrado), para ello se transforman los valores S2 (varianzas
muestrales) a valores de χ2 mediante la siguiente relación:

χ2 = (n - 1). S2 / σ2 para v = n - 1 (grados de libertad).

Nota: El único requisito para usar la distribución chi cuadrado es que la


población esté distribuida normalmente

Ejemplo:
En una empresa, la desviación estándar del sueldo de los empleados es de
Bs. 75000, correspondiente a valores distribuidos normalmente. Para un nuevo
estudio se escogen 17 empleados cuyos salarios se muestran a continuación:

SUELDOS
156000 174000 162000
175000 269000 298000
185000 320000 450000
200000 260000 364000
225000 158000 300000

Se desea conocer si estos resultados muestran consistencia con respecto a


la desviación, en cuanto a la variabilidad del sueldo de los empleados de dicha
empresa.
Solución:

Cuando se habla de variabilidad nos referimos a la varianza ó desviación


estándar, por lo que debemos calcular la desviación muestral, esto es S =
87325,99 Bs. Por lo tanto:

 (n − 1) S 2 16.(87325,99) 2 
P( S > (87325,99) ) = P
2 2
> ( )
 = P χ 2 > 21,69 = 0,15 .
 σ
2
5625000000 

Los resultados muestran consistencia ya que es más probable que la


varianza muestral para muestras de tamaño n = 17 estén por debajo de Bs.
87325,99

5) DISTRIBUCIÓN F DE FISHER.
Cuando se quiere estudiar la relación entre las varianzas de dos
poblaciones distribuidas normalmente se usa la distribución F de Fisher. Es decir,
dadas dos muestras aleatorias independientes de tamaño n1 y n2 de dos

S 2M
poblaciones independientes, la distribución muestral de la razón F = 2 (razón
Sm
de varianzas) se conoce como distribución de Fisher, suponiendo que las
varianzas poblacionales son iguales ( σ21 = σ22 ). Donde:

S M2 : es la varianza mayor
S m2 : es la varianza menor
con (v1 , v 2 ) donde v1 = n 1 − 1 grados de libertad del numerador
v 2 = n 2 - 1 grados de libertad del denominador
Ejemplo:
Considerando que las varianzas poblacionales de dos poblaciones son
iguales, σ21 = σ22 , n1= 6 y n2 = 10, hallar la probabilidad de que la razón
de las varianzas muestrales no exceda a 3,48.

Solución: Cuando se quieren comparar las varianzas muestrales de


S12
dos poblaciones se utiliza la distribución F de Fisher, por lo tanto, F =
S 22

con v1 = 5 y v2=9 grados de libertad.También la probabilidad pedida viene


dada por:

 S12 
P 2 ≤ 3,48  = P(F ≤ 3,48) = 1 − P( F > 3,48) = 1 − 0,05 = 0,95
 S2 

Nótese que aún cuando las varianzas de las poblaciones son iguales, la
probabilidad de que la razón de las varianzas de las muestras exceda a 3,48 es
de 0,05 suponiendo tamaños de muestras de n1 = 6 y n2 = 10.

Tamaño de la Muestra.
La clave del problema estriba en escoger una muestra cuyo selección
garantice la representatividad de la población objeto de estudio. En los estudios
socio-económicos, una muestra de un 30% de la población, tiene un elevado nivel
de representatividad (Ramírez 1995); sin embargo, esta representatividad
depende mayormente, del tipo de muestreo. Obviamente, que el trabajar con
muestras, por muy confiables que sean, no se obtiene el 100% de exactitud, sin
embargo, ese pequeño error que acompaña siempre a los estudios por muestreo,
es compensado con el tiempo y costo ahorrado al trabajar con grupos pequeños
en vez de toda la población.

• Determinación del Tamaño de la Muestra en una población infinita, cuando


se utilizan proporciones:

2
 Zα 
 
n= 2  .p.q
 ∈ 
 
Donde:
n: Tamaño de la muestra
Zα/2: Valor teórico en función del nivel de confianza. Para 99 %, Zα/ 2 es igual a
2,56 y para el 95% a Zα/2 le corresponde 1,96

ε: error de muestreo
p: Número de veces que se produce un evento en %
q: Es el porcentaje complementario de p

Ejemplo: Opinión de los electores sobre gestión de gobierno.


Se realizó un estudio piloto de 150 electores donde 60 opinan favorablemente. ¿A
cuantas personas es necesario encuestar si se desea un nivel de confiabilidad de
99 % y un error de muestreo +/- 1.5%?.
Entonces se tiene:

2
 Zα 
 
n= 2  .p.q El valor de p viene dado por:
 ∈ 
 
p = 60 / 150 X 100 = 40%, por lo tanto q = 100 - 40 = 60%.

2
 2,56 
De esta forma se tiene: n =   . 0,4. 0,6 = 6.991 . Es necesario
 0,015 
encuestar a 6.991 personas para alcanzar cierta confiabilidad en los resultados.

En el caso de una Población Infinita con 95 % de Confiabilidad.

Utilizando el ejemplo anterior, se tiene:


2
 1,96 
n=  . 0,4. 0,6 = 4098
 0,015 

Al bajar el coeficiente o el nivel de confiabilidad, también baja el tamaño de la


muestra.

• En el caso de que no exista un Estudio Piloto.

A los valores de p y q se les asigna el valor de 50% a cada uno y es lo que se


denomina Condiciones desfavorables de muestreo. En el caso del ejemplo
citado el tamaño de la muestra viene determinado de la siguiente manera:

2
 1,96 
n=  . 0,5. 0,5 = 4.268
 0,015 
Esto quiere decir que habrá que encuestar a 4.268 personas.
• En el caso de poblaciones finitas, el modelo matemático difiere con el
de las poblaciones infinitas:

Z α/2 .p.q.N
n=
∈2 (N − 1) + Z α/2 .p.q

Donde: N es el tamaño de la población y n el tamaño de la muestra.

Se puede aplicar en el siguiente caso: Conocer la opinión de los miembros


de un sindicato, ante un nuevo contrato colectivo. Compuesto por 3.257
obreros. Cuántas obreros se deben entrevistar para obtener un nivel de
confianza de 99 % y un error de muestreo de +/- 3%, en condiciones
desfavorables?

2,562 . 0,5 . 0,5. 3257


n= = 1.168
0,032 (3257 − 1) + 2,562.0,5.0,5

Se requieren encuestar a 1.168 obreros, para lograr cierto grado de


Confianza.
• Determinación del Tamaño de la Muestra en una población para medias.
En este caso se utiliza la relación:

2
 Zα.σ
 
n= 2 
 ∈ 
 
Ejemplo: Se quiere estudiar la vida útil media de una marca de
neumáticos. Si sabe por estudios anteriores que la desviación estándar es de
800 Km . Determinar el tamaño de la muestra requerido para un nivel de
confianza del 95 %, fijando un error de 40.

Sustituyendo los valores se tiene

2 2
 1,96. 800   1568 
n=  =  = 1536,64 ≈ 1537 neumáticos
 40   40 

En conclusión, la validez en la investigaciones de negocios, está muy


relacionada con la confiabilidad del muestreo y una muestra confiable está en
función del tipo de población a estudiar ( finitas o infinitas); asi mismo, en
cuanto al nivel de confiabilidad, ésta será mayor si la muestra es mayor y en
relación al error de muestreo, éste será menor cuando la muestra es mayor.
Para determinar el tamaño de la muestra de una forma mas rápida y práctica,
se han diseñado las Tablas de Harvard, las cuales permiten calcular,
rapidamante el tamaño de la muestra a tomar, en función del error de
muestreo, niveles de confiabilidad y posibles valores de p y q.

Para profundizar en este aspecto de muestreo, se recomienda consultar los


textos especializados en estas áreas. Pues una vez determinado el tamaño de
la muestra el paso siguiente que se plantea es lo relacionado al tipo de
muestreo que se va a utilizar para escoger los elementos que integran a la
muestra y ésto es un amplio e interesante tema a tratar.
CAPITULO IV

EL CONTROL ESTADÍSTICO DEL PROCESO

OBJETIVOS:

Conocer los métodos estadísticos utilizados en el control de procesos y


aplicar las herramientas específicas para cada caso, con la finalidad de detectar y
corregir posibles fallas.

1. INTRODUCCION:

La estadística descriptiva y la inferencial así como la teoría de


probabilidades, tienen un campo muy amplio de aplicación en la industria,
especialmente en el control de la calidad y en el análisis de procesos.

En los procesos de producción se generan simultáneamente grandes


volúmenes de información cuantitativa y cualitativa a través de las cuales se
pueden controlar los costos, la producción y la calidad, es decir, lo que significa el
control de gestión administrativa de la compañía.

La recopilación, presentación y análisis de este flujo de información permite


a la gerencia conocer los resultados y establecer controles y así mismo comparar
los resultados obtenidos con lo deseado, pudiendo establecer acciones correctivas
cuando se observen discrepancias significativas entre ellos.

El Control Estadístico de la Calidad es el conjunto de acciones


orientadas a cumplir con las metas de calidad previamente establecidas, utilizando
para ello las técnicas estadísticas aplicables al menor costo posible.
Lo importante del Control de Calidad es que constituye una herramienta
muy eficaz para incrementar la productividad, permitiendo elevar el nivel técnico
de la empresa, incrementando la producción y reduciendo los costos de operación.
De esta forma, el propósito del control de la calidad es fijar la calidad normal,
mantener y mejorar el nivel, la uniformidad y la confiabilidad de la calidad
garantizando ésta y reduciendo los costos de fabricación, suministrar productos a
la satisfacción del cliente aumentando los beneficios.

Como se observa, el control de calidad involucra el proceso total de:


comercialización, investigación, desarrollo, producción, transporte, instalación y
mercadeo, sin soslayar todas aquellas funciones tendientes a maximizar el
beneficio.

2. METODOS ESTADISTICOS:
Este control moderno de la calidad implica el uso de métodos estadísticos,
siendo denominado Control Estadístico de la Calidad cuya aplicación es
ampliamente utilizada en diferentes áreas tales como: análisis de procesos, control
de procesos, investigación, desarrollo, etc.
En función de ello se puede establecer una estructura basada en:

Ingeniería de Control de Calidad: Encargada del planeamiento de


calidad de una empresa.

Ingeniería en Control de Procesos: Supervisa la aplicación adecuada del


sistema del control de calidad en la fabricación.

Ingeniería de equipos de información: Diseña y desarrolla el equipo para


la inspección y el ensayo.
Entre los métodos estadísticos de mayor uso se tienen:
a. Gráficas de control.
b. Distribución de frecuencia, histogramas y diagramas de pareto.
c. Distribuciones estadísticas.

d. Ensayo de significación.

e. Inspección por muestreo.

f. Diseño de experimento y análisis de la varianza.

En el cuadro que a continuación se presenta se resume las diferentes áreas


de control y las técnicas utilizadas en cada una de ellas:

CONTROL TAREA TECNICAS UTILIZADAS


CONTROL Planeamiento de la Análisis de la función producto, pruebas
DE NUEVOS calidad del producto y ambientales, prototipo, evaluación ,
DISEÑOS proceso, standard, estándares de calidad, análisis de
costos, especificaciones materia prima, inspección,
del proceso, confiabilidad. entrenamiento, almacenamiento y
transporte.
MATERIA Controles de recepción y Evaluación de proveedores,
PRIMA almacenamiento, instrumentos de medición ,
economía y costos. entrenamiento, muestreo,
especificaciones, características de
calidad, lotes rechazados y aceptados,
análisis estadísticos, etc.
PRODUCTO Control del producto Control de procesos, productos
Y PROCESO desde su fabricación, terminados, control de herramientas,
establecer correctivos, mantenimiento, personal, condiciones
servicios. ambientales, inspección, cartas de
control, muestreo, planos, auditoría,
defectos, empaque y despacho,
servicios.
ESTUDIOS Investigaciones y ensayo Gráficas. distribución de frecuencias,
ESPECIALES para mejorar la calidad. diagramas de fallas, análisis de pareto,
diferentes métodos estadísticos,
pruebas de hipótesis, distribución t, chi
cuadrado, análisis de la varianza,
correlaciones y regresiones, análisis
secuencial.
El análisis de procesos no viene a ser más que la aplicación de métodos
científicos al reconocimiento y a la formulación de problemas y al desarrollo de
procedimientos para resolverlos. Esto significaría: la especificación matemática del
problema para una situación física determinada y realizar el análisis
pormenorizado para obtener los modelos matemáticos, lo cual conduciría a la
síntesis y presentación de los resultados para asegurar su comprensión y posible
aplicación.

El análisis estadístico desempeña un papel importante en el estudio de los


procesos. El método de encontrar las causas de los productos con defectos, es lo
que se denomina Diagnóstico del Proceso. Para reducir el número de productos
defectuosos la primera acción es la de hacer un diagnóstico correcto para
determinar las causas de los defectos.

Existen muchos métodos para hacer un diagnóstico correcto, algunos


basados en la intuición y otros en la experiencia. En este trabajo se recurrirá al
análisis estadístico de los datos; la forma estadística de considerar las cosas y el
uso de los métodos estadísticos constituye un medio muy valioso para hacer las
observaciones.

1. CARTAS DE CONTROL.
De acuerdo con E.L. Grant (Statistical Quality Control) la calidad medida de
un producto manufacturado, está siempre sujeta a una cierta variación fortuita.
Algún sistema estable de causas fortuitas es inherente a cualquier esquema
particular de producción e inspección. La variación propia de este modelo estable
es inevitable, pero las razones para la variación fuera de este modelo estable
pueden ser descubiertas y corregidas.
La carta control desarrollada por Shewhart (Economic Control of Quality of
Manufatured Product.) es un dispositivo gráfico para detectar modelos no
naturales de variación en los datos resultantes de procesos repetitivos, lo cual
permite fijar un criterio para detectar deficiencias en el control estadístico. En estas
cartas los puntos muestreados son representados gráficamente de una forma
secuencial y posteriormente unidos por una línea facilitando la interpretación
visual.

FIGURA 7.GRAFICA DE CONTROL


Las pruebas más comunes para modelos no naturales son las pruebas de
inestabilidad, las cuales permiten determinar si el sistema de causas está
cambiado, comúnmente se les designa como las zonas A, B, y C.

Como referencia a estas zonas, el modelo de variación observado se dice


que es no natural o que el proceso está fuera de control si ocurre uno o más de los
siguientes eventos:
1.- Un sólo punto cae fuera del límite de control.
Por ejemplo más allá de la zona A.
2.- Dos de tres puntos sucesivos, caen en la zona B o más allá

3.- Cuatro de cinco puntos sucesivos caen en la zona B o más allá

4.- Ocho puntos sucesivos caen en la zona C o más allá

Estas pruebas se aplican separadamente a ambas mitades de la Carta


Control.

Las cartas más comúnmente usadas son: Carta X, la Carta R, la Carta p, y


la carta c; las dos primeras tratan con datos de medición, mientras que las dos
últimas tratan con datos de atributos. (Enumeración).

FÓRMULAS PARA LAS CARTAS DE CONTROL:

Línea Límite superior Límite inferior


Carta Distribución Central de control (LSC) de control (LIC)
_ _ _ _
X Normal X X + A2 R X - A2 R

R Normal R D4 . R D3 . R.

p Binomial p p + 3√p (1-p) / n p - 3√p (1-p) / n

c Poisson c c+3 √c c-3 √c


Las constantes A2 , D3 y D4 están tabuladas (ver anexo), mientras que
las cantidades X, R, p, y c se calculan de los datos suministrados.

Planes de Muestreo:

El muestreo de aceptación puede ser de dos tipos: muestreo lote por lote
también denominado muestreo por atributos y muestreo de producción continuo o
muestreo variable. Los primeros se refieren a los casos donde cada espécimen es
clasificado simplemente como defectuoso o no defectuoso; en los planes variables
se refiere a los casos en los cuales una medida es tomada y registrada
numéricamente en cada espécimen inspeccionado. El plan de muestreo por
atributos que se efectúa en base de lote, está definido por tres elementos: el
tamaño del lote (N), el tamaño de la muestra (n) y el número de aceptación A³.

Ejemplo:

La tabla que se exhibe a continuación muestra los valores


codificados de la resistencia a la compresión de bloques de concreto.
VALORES CODIFICADOS DE LA RESISTENCIA A LA COMPRESIÓN DE
BLOQUES DE CONCRETO

Número de Media Rango


la Muestra X1 X2 X3 X4 X5 (X) (R)

01 11.1 9.4 11.2 10.4 10.1 10.44 1.8

02 9.6 10.8 10.1 10.8 11.0 10.46 1.4

03 9.7 10.0 10.0 9.8 10.4 9.98 0.7

04 10.1 8.4 10.7 9.4 11.0 9.82 2.6

05 12.4 10.0 10.7 10.1 11.3 10.90 2.4

06 10.1 10.2 10.2 11.2 10.1 10.36 1.1

07 11.0 11.5 11.8 11.0 11.3 11.32 0.8

08 11.2 10.0 10.9 11.2 11.0 10.86 1.2

09 10.6 10.4 10.5 10.5 10.9 10.58 0.5

10 8.3 10.2 9.8 9.5 9.8 9.52 1.9

11 10.6 9.9 107 10.2 11.4 10.56 1.5


12 10.8 10.2 10.5 8.4 9.9 9.96 2.4

13 10.7 10.7 10.8 8.6 11.4 10.44 2.8

14 11.3 11.4 10.4 10.6 11.1 10.96 1.0


15 11.4 11.2 11.4 10.1 11.6 11.14 1.5

16 10.1 10.1 9.7 9.8 10.5 10.04 0.8

17 10.7 12.8 11.2 11.2 11.3 11.44 2.1

18 11.9 11.9 11.6 12.4 12.4 11.84 1.0

19 10.8 12.1 11.8 9.4 11.6 11.14 2.7

20 12.4 11.1 10.8 11.0 11.9 11.44 1.6

Promedio 10.66 1.59


De la tabla anterior tenemos que:

_ _ 213.20
X = ∑ X/K = --------------- = 10.66
20

31.8
R= ∑ R/K = ---------------- = 1.56
20
_
De acuerdo a las fórmulas establecidas, para la Carta X:
_
LSC = X + A2 . R

LSC = 10.66 + (0.58) (1.59) = 11.558

LIC = 10.66 - (0.58) (1.59) = 9.74

FIGURA 8. CARTA X
Igualmente para la Carta R:

LSC = D4 . R = (2.12) (1.59) = 3.37

LIC = D3 . R = (0) (1.59) = 0

FIGURA 9. CARTA R

Si tratamos con datos de enumeración como por ejemplo el número de


fusibles defectuosos escogidos en muestras de tamaño 50, tomados en tiempos al
azar durante el proceso de producción; podemos emplear la Carta p.
Número de muestra Número de defectuosos Fracción defectuosa (p)

1............................. 2 0.04
2............................. 1 0.02
3............................ 2 0.04
4............................ 0 0.00
5............................ 2 0.04
6............................ 3 0.06
7............................ 4 0.08
8............................ 2 0.04
9............................ 0 0.00
10......................... 3 0.06
11......................... 0 0.00
12......................... 1 0.02
13......................... 2 0.04
14......................... 2 0.04
15......................... 3 0.06
16......................... 5 0.10
17........................ 1 0.02
18......................... 2 0.04
19........................ 3 0.06
20........................ 1 0.02
21....................... 1 0.02
22....................... 1 0.02
23....................... 4 0.08
24....................... 2 0.04
25....................... 2 0.04
26....................... 4 0.08
27...................... 1 0.02
28...................... 3 0.06
29...................... 3 0.06
30..................... 2 0.04
31..................... 3 0.06
32..................... 6 0.12
33..................... 2 0.04
34..................... 3 0.06
35..................... 2 0.04
36.................... 3 0.06
37.................... 1 0.02
38................... 0 0.00
39................... 2 0.04
40................... 0 0.00

Promedio..................... 0.042
De esta tabla de valores se comprueba:
1.68
p= ∑ p/K =  = 0.042
40

Aplicando la Ecuación correspondiente

LSC = p + 3 √ p (1- p) / n

LSC = 0.042 + 3 √(0.042) (0.958) /50 = 0.127

LIC = 0.042 - 3 √(0.042) (0.958) /50 = - 0.043

Como el LIC resulta un valor negativo y debido a que la fracción


defectuosa es una cantidad no negativa, este límite se toma como
cero, lo cual hace a los límites de control asimétricos con respecto a la
línea central.

FIGURA 10. CARTA p


Si interesa determinar el número de defectos por unidad, la Distribución de
Poisson y una carta C sería lo más apropiado. A continuacción se presentan los
datos tabulados del número de defectos observados en una junta soldada,
realizando cada conteo en una sola junta, soldándose 8 juntas por hora.

Número de muestra Fecha Tiempo de la muestra Nºde defectos (c)


1................. Julio 18 8:00 A.M 2
2................. 9:05 A.M. 4
3................. 10:10 A.M. 7
4................. 11:00 A.M. 3
5................. 12:30 PM. 1
6................. 1:35 P.M. 4
7................. 2:20 P.M. 8
8................. 3:30 P.M. 9

9.................. Julio 19 8:10 A.M. 5


10................ 9:00 A.M. 3
11................. 10:05 A.M. 7
12................. 11:15 A.M. 11
13................ 12:25 P.M. 6
14................ 1:30 P.M. 4
15................. 2:30 P.M. 9
16................. 3:40 P.M. 9

17................ Julio 20 8:00 A.M. 6


18................ 8:55 A.M. 4
19................ 10:00 A.M. 3
20................ 11:00 A.M. 9
21................ 12:25 P.M. 7
22................ 1:30 P.M. 4
23................ 2:20 P.M. 7
24................ 3:30 P.M. 12

Total................................... .............. 144


Del cuadro anterior y aplicando las ecuaciones correspondientes tenemos:

144
c= ∑ c/K =  = 6
24
_ _
LSC = c + 3 √c

LSC = 6 + 3 √ 6 = 13.35

LIC= 6 - 3 √6 = - 1.35

FIGURA 11. GRAFICA DE CONTROL

En esa gráfica no se presentan puntos por encima del LSC; igualmente, el


mismo patrón aparece cada medio día; este patrón recurrente sugiere un factor de
fatiga que debe ser tomado en cuenta
2. DIAGRAMA DE CAUSA EFECTO

Es una representación gráfica de la relación entre un efecto y todas las


posibles causas que influyen en él, permitiendo identificarlas y clasificarlas para su
análisis. Es llamado también diagrama de Ishikawa o Espina de Pescado. (Ver
figura en la página siguiente).

CAUSAS EFECTO

METODOS MAQUINAS MATERIALES

CALIDAD

MANO DE OBRA MEDICIONES

FIGURA 12. DIAGRAMA CAUSA-EFECTO

Ejemplo

Después de haberse realizado un análisis de las principales causas


que originan bobinas desviadas en el laminador tandem 1, se encontró que
manchas contaminantes afectaba en gran proporción los resultados de
calidad. El equipo de trabajo realizó un estudio utilizando el diagrama causa-
efecto el cual se presenta a continuación:
CAUSAS EFECTO

METODOS MAQUINAS MATERIALES


FUGA DE MATERIAL DE
FALTA DE
FALTA DE ACEITE DECAPADO
COORDINACION SECADOR DE
COMUNIC.
BANDAS ACEITE
PERMANANENCIA FILTRO DE
CRITERIOS NO EXTRATOR DE DEL MATERIAL DE EMULSION
UNIFORMES GASES ALMACENAMIENTO
MANCHAS
CONTAMI-
EXPERIENCIA DEL
AUSENCIA DE NANTES
INSTRUENTOS CALIBRACION DEL
PERSONAL
DE MEDICION SECADOR EN
FUNCION
OPERACION DE
FALTA DE EQUIPOS DEL ANCHO DE BANDA
EMULSION
SENSIBLES
FALTA DE EQUIPO DETECTOR
AL MATERIAL
DE MANCHAS
MOJADO
MANO DE OBRA MEDICIONES

FIGURA 13. REPRESENTACIÓN GRAFICA DEL EJEMPLO

3. DIAGRAMA DE PARETO

a. Es un gráfico de barras que jerarquiza los problemas, condiciones o


las causas de éstos, por su importancia e impacto siguiendo un
orden descendente de izquierda a derecha.

b. Es utilizado cuando se necesita determinar el orden de importancia


de los problemas o condiciones a fin de seleccionar el punto de inicio
para la solución de dichos problemas o la identificación de la causa
fundamental de ellos.
FIGURA 14. DIAGRAMA DE PARETO
Ejemplo

Defectos encontrados en una inspección

1.- Presencia de óxido

2.- Falta de identificación.

3.- Manchas de aceite.

4.- Mala ubicación.

FIGURA 14. REPRESENTACIÓN GRAFICA DEL EJEMPLO


4. GRAFICO DE CORRIDAS

Es una representación gráfica mediante líneas del comportamiento


de una variable en un proceso durante un período determinado, es utilizado
cuando se necesita mostrar las tendencias de puntos observados, dentro de
un período de tiempo especificado.

FIGURA 15. MODELO DE GRAFICO DE CORRIDAS

PASOS PARA LA ELABORACIÓN DE UN GRAFICO DE CORRIDAS:

1. Determinar la variable del proceso a medir.


2. Establecer la escala a utilizar en los ejes:
a. El eje horizontal X , representa el período de tiempo y
b. El eje vertical Y, representa los valores de la variables del proceso.
3. Indicar con puntos los valores encontrados en cada una de las
mediciones y proceder a unir dichos puntos mediante el uso de líneas.
4. Calcular el promedio de los valores.
5. Representar en el gráfico el promedio determinado trazando una línea
horizontal.
6. Interpretar el gráfico resultante.

5. HISTOGRAMA DE FRECUENCIA

Es una gráfica de barras que muestra la frecuencia con que ocurre


una determinada característica que es objeto de observación. Es utilizada
comúnmente cuando se requiere mostrar la distribución de los datos y
representar la variación propia de un proceso.

FIGURA 15. MODELO DE HISTOGRAMA


6. ANÁLISIS DE REGRESION

En muchas situaciones que se presentan a menudo en el campo de la


ciencia, la ingeniería o las ciencias económicas nos encontramos con el problema
de la relación entre dos variables numéricas. Por ejemplo, la relación entre la
temperatura de un paciente y el número de pulsaciones por minuto o la relación
entre el costo de un producto y el costo de la mano de obra para fabricarlo.
Muchas veces existen ecuaciones matemáticas que nos permiten calcular una
variable conociendo el valor de otra de la cual depende.

En general, cuando se nos presentan dos variables numéricas X e Y,


podemos encontrar distintos tipos de relación entre ellas. Puede ocurrir que entre
ellas no exista ningún tipo de relación. En tal caso, la variación de una de ellas no
genera una variación correlativa en la otra. Variación correlativa significa que cada
vez que X aumenta, Y debe aumentar si hay correlación positiva o cada vez que X
aumenta, Y debe disminuir en caso de correlación negativa. Pero si cada vez que
X varía, Y puede aumentar o disminuir al azar en cualquie grado y proporción,
entonces significa que no hay ninguna correlación entre ambas:

Ninguna correlación

50
45
40
35
Variable Y

30
25
20
15
10
5
0
0 2 4 6 8 10 12

Variable X
Cuando hay una relación funcional entre X e Y, es decir Y=F(X), la
correlación entre ambas es perfecta. Supongamos que medimos el valor de Y para
un determinado valor de X, y que dicho valor de X lo podemos fijar con exactitud
(En general, esto no va a ser cierto). La ecuación de la función nos da un valor de
Y para ese valor de X. El valor de Y medido y el valor de Y calculado con la
ecuación, en general, no van a coincidir. Si repitiéramos la medición de Y muchas
veces para el mismo valor de X, tendríamos una serie de valores que son
diferentes del valor calculado. Pero si seguimos este proceso, obtendremos una
población de valores de Y cuyo promedio sí va a coincidir con el valor calculado.
Es decir, la relación funcional expresada por la ecuación matemática se cumple
para los promedios de los X e Y medidos, porque la mediciones individuales están
sujetas al error experimental o error de medición. Veámoslo con un ejemplo. Si
dejamos caer una pelotita desde el borde de una mesa, la distancia que recorre
desde el borde hasta tocar el suelo se puede calcular por medio de la ecuación
siguiente:

1
Y = f (t ) = ⋅ g ⋅t2 g Aceleracion Gravitatoria
2

Hay una relación funcional no lineal entre la altura Y desde la cual cae la
pelotita y el tiempo t que tarda en caer, expresada por la ecuación anterior. Si
dejamos caer la pelotita midiendo con un cronómetro el tiempo que tarda en llegar
al suelo y medimos también la distancia recorrida (la altura de la mesa), los
valores resultantes de la medición seguramente no cumplen con esa relación. Esto
lo podemos verificar reemplazando t en la ecuación por el tiempo obtenido con el
cronómetro. El valor resultante Y seguramente no va a coincidir con nuestra
medición de la altura de la mesa. Si repetimos esto muchas veces, las mediciones
de tiempo y distancia realizadas en cada ocasión, en general, no van a cumplir la
relación. Pero si promediamos todas la mediciones de tiempo y luego
reemplazamos t en la ecuación por este promedio, la distancia calculada con la
ecuación sí va a coincidir con el promedio de todas las mediciones de altura de la
mesa.

Entre las dos posibilidades extremas, la de no tener ninguna relación entre


las variables y la de tener una relación funcional, hay infinitas situaciones
intermedias, en las cuales hay un cierto grado de correlación entre ambas:

Hay alguna correlación

50
45
40
35
Variable Y

30
25
20
15
10
5
0
0 2 4 6 8 10 12

Variable X

En muchos problemas prácticos de la industria y de la economía se trata de


conocer en forma empírica la relación entre dos variables, de tal manera que si se
tiene un valor de la variable X se pueda obtener por cálculo o en forma gráfica el
valor de la variable Y, sin importar si existe una verdadera relación funcional entre
ambas variables. Por ejemplo, supongamos que tenemos una grupo muy grande
de personas de sexo masculino, de edad entre 30 y 40 años. Se nos presenta el
problema de relacionar las variables peso y estatura, de tal manera que,
conociendo la estatura en metros de un individuo del grupo, podamos calcular su
peso en Kg. Entre ambas variables no existe una relación funcional. Esto lo vemos
fácilmente si tomamos algunos individuos cuya estatura sea la misma, por
ejemplo, 1,75 mts. y medimos el peso de cada una. Resulta claro que las
mediciones van a ser diferentes, una pesará 73 Kg., otra 79 Kg., etc. y estas
diferencias no se deben al error de medición, sino a diferencias reales en el peso
de las personas:

Gráfico de peso vs. altura

130
120 Peso de personas de
110 1,75 mts.
100
Peso (Kg.)

90
80
70
60
50
40
1,60 1,70 1,80 1,90 2,00 2,10

Altura (m ts.)

Quiere decir que para un determinado valor de la variable estatura podemos


encontrar múltiples valores de la variable peso, lo cual niega la existencia de
relación funcional. No obstante, existe un importante grado de correlación entre
ambas variables, porque sabemos que a medida que aumenta la estatura de las
personas dentro del grupo, el peso tiende a aumentar. ¿Cómo podemos hacer,
entonces, para estimar el peso de una persona conociendo su estatura?

Para ello, vamos a suponer un procedimiento hipotético: Tomamos del


grupo un número muy grande de personas que miden exactamente 1,65 mts., las
pesamos y promediamos los resultados. Repetimos el procedimiento para grupos
que miden 1,70 mts., 1,75 mts., etc. y luego representamos gráficamente los
promedios de peso en función de dichas alturas:

Regresión del peso sobre la altura

130
120
110
100
Peso (Kg.)

90
80
70
60
50
40
1,60 1,70 1,80 1,90 2,00 2,10

Altura (m ts.)

La representación resultante se denomina Regresión del peso sobre la


altura, y a la ecuación correspondiente Ecuación de Regresión. Una vez hecho
esto, disponemos de una forma sencilla de estimar el peso de una persona del
grupo conociendo la altura: con la misma entramos al gráfico y obtenemos el valor
de Y correspondiente. Este valor Y es el promedio de los pesos de las personas
del grupo que miden una altura X, y sólo nos sirve como una estimación
(aproximación) del peso real de la persona cuyo peso deseamos conocer.
También podemos utilizar la ecuación de regresión para calcular el peso. La forma
de la representación gráfica puede ser una recta u otro tipo de curva. Cuando es
una recta decimos que es una regresión lineal, y de ahora en mas nos referiremos
a este tipo de regresiones.
El procedimiento real para obtener la regresión utiliza un método que se
conoce como Método de los Cuadrados Mínimos. Se toma una muestra aleatoria
de personas del grupo que cubran todo el rango de alturas y a cada una se le
mide el peso y la altura. Si representamos estos puntos en un gráfico, veremos
que se agrupan aproximadamente alrededor de una recta imaginaria, que
representa los puntos de la regresión. Parece lógico pensar que la recta de la
regresión debe pasar muy cerca de los puntos experimentales (las mediciones que
realizamos). Si hacemos pasar esta recta imaginaria por el punto correspondiente
a uno de los individuos la estamos alejando, probablemente, de los otros puntos.
Es decir que, la recta de regresión debe pasar a una distancia óptima de los
puntos experimentales, de tal manera que esté lo mas cerca posible de todos
ellos. Esto es lo que se trata de hacer con el método de los cuadrados mínimos.
Entonces, tenemos una serie de valores de la variable X, para cada uno de los
cuales se mide la variable Y:

X Y
X1 Y1
X2 Y2
X3 Y3
X4 Y4
X5 Y5
X6 Y6
etc.

La ecuación de la recta de regresión será de la forma:

Y R = a + bX

Si ingresáramos en esta ecuación los valores X1 , X2 , X3 , etc. obtendríamos los


valores de Y de la regresión: Y1R , Y2R , Y3R , etc. Las diferencias entre estos valores
calculados y los valores Y medidos se denominan residuos:
(Y 1
R
)
− Y1
(Y 2
R
−Y ) 2

(Y 3
R
−Y ) 3

...............
etc.

Si elevamos las diferencias o residuos al cuadrado y sumamos estos


cuadrados, obtenemos una cantidad denominada suma de cuadrados alrededor
de la regresión:

∑ (Y i
R
) [
− Yi = ∑ ( a + b ⋅ X i ) − Yi ]

De todas las rectas posibles que pasan por los puntos representados en el
gráfico, la recta de regresión debe ser la que haga mínima esa suma de
cuadrados. Observemos que en dicha suma de cuadrados conocemos los valores
Xi , Yi (Son la mediciones que realizamos) y deseamos conocer a y b, que son los
coeficientes de la ecuación de regresión. Para obtenerlos se calcula el mínimo de
la suma de cuadrados y de las ecuaciones resultantes se despejan las fórmulas de
ambos coeficientes, que son como sigue:

n∑ X i ⋅ Yi − ∑ X i ⋅ ∑ Yi
b=
n∑ X 2 − (∑ X )
2
i

a = Y −b⋅ X

donde

X =
∑X i
Y=
∑Y i

n n
Son los promedios de Xi e Yi respectivamente y n es el número de pares
de observaciones Xi , Yi . De esta forma, ¿Cómo podemos conocer cual es el
grado de vinculación entre ambas variables? Para ello, calculamos el Coeficiente
de Correlación, que es un número real entre 0 y 1 que nos da el grado de
correlación entre dos variables X e Y. Cuando este coeficiente es 0, la correlación
entre ambas variables no existe; cuando es 1, hay una correlación perfecta, es
decir, tenemos una relación funcional entre ambas. El coeficiente de correlación es
el cociente entre la Covarianza y las desviaciones standard de X e Y:

R=
Cov( X , Y )
=
∑( X i )(
− X ⋅ Yi − Y )
s X ⋅ sY
∑( X ) ⋅ ∑ (Y − Y )
2 2
i −X i
AJUSTES DE CURVAS.

Cuando se quiere estudiar la relación entre variables se puede


recurrir a dos tipos de modelos:

a) Modelo Determinístico, la relación viene definida a través de una


fórmula. Por ejemplo, sea y = x2, entonces se dice que y está en función
de x, donde y se conoce como variable dependiente y x variable
independiente. La característica fundamental de este modelo es que
para un valor particular de x siempre obtenemos el mismo resultado en
y, esto significa que la relación entre las variables es perfecta. Ver
gráfica.

10
8
6
4
2
0
-4 -3 -2 -1 0 1 2 3 4

b) Modelo Probabilistico, la relación entre las variables no es perfecta, ya


que debido a una perturbación aleatoría (ruido) a veces para un mismo valor
de la variable independiente x se obtienen valores diferentes para y. En este
caso, no se obtiene una curva sino un diagrama de dispersión.
Considerando el ejemplo anterior, y = x2 + ε donde ε es un ruido. Ver
gráfica.

10
8
6
4
2
0
-4 -3 -2 -1 0 1 2 3 4
Por tanto, los modelos probabilísticos son útiles cuando se realizan
investigaciones del tipo experimental donde a pesar de mantener fijo los
valores de la variable independiente ocurren fluctuaciones debido
fundamentalmente a errores de medición, de los equipos, etc. En el
presente trabajo estamos interesados en este tipo de modelos. A
continuación mencionamos los modelos de ajustes más usados:
Regresión simple: Se define como la curva que optimiza (minimiza),
mediante el método de los mínimos cuadrados, los saltos o fluctuaciones de
los datos. Es decir, es la curva que mejor ajusta los valores del diagrama de
dispersión convirtiendo el modelo probabilístico en un modelo determinístico
con la finalidad de realizar predicciones. De igual forma, la curva de
regresión permite modelar la tendencia de los valores. Los modelos de
regresión simple vienen definidos por y = f(x)+ε. A continuación veamos los
distintos modelos con su respectivo ajuste o curva de regresión:

Modelos Probabilísticos Curva de Regresión

a) Lineal: y = ax + b + ∈ yˆ = aˆx + bˆ (línea recta)

18 18

16 16

14 14

12
12
10
10
8
8
6
6
4
4
2
2 0
0 0 2 4 6
0 2 4 6
b) Polinómico:

orden dos: y = ax 2 + bx + c + ∈ yˆ = aˆx 2 + bˆx + cˆ (parábola)

30 30

25 25
20
20
15
15
10
10
5
5
0
0 0 2 4 6

orden tres: y = ax 3 + bx 2 + cx + d + ∈ yˆ = aˆx 3 + bˆx 2 + cˆx + dˆ

800

800 700
700 600
600 500
500
400
400
300
300
200
200
100
100
0
0
0 2 4 6 8 10
0 5 10
c) Logarítmico: y = aLn( x) + b + ∈ yˆ = aˆLn( x) + bˆ

12
14
10
12
8
10
6 8

4 6

2 4

2
0
0 2 4 6 8 10 0
0 2 4 6 8 10

ˆ
d)Potencial: y = ax b + ∈ yˆ = aˆx b

140
120
120
100
100
80
80
60
60
40
40
20
20
0 0
0 2 4 6 8 10
0 2 4 6 8 10
ˆ
e) Exponencial: y = ae bx + ∈ yˆ = aˆe bx

1,00 1,00

0,90 0,90
0,80 0,80
0,70 0,70
0,60 0,60
0,50 0,50
0,40 0,40
0,30 0,30
0,20 0,20
0,10
0,10
0,00
0,00
0 2 4 6 8 10
0 2 4 6 8 10

El procedimiento en un análisis de regresión consiste en calcular


los estimadores ( aˆ , bˆ, cˆ y dˆ ) que definen la curva que mejor ajusta los
datos. En la actualidad, existen paquetes estadísticos que permiten
calcular los estimadores y la curva de regresión directamente, sin
necesidad de realizar los cálculos manualmente. (Excell, Statgraph,
SSPS y otros).
REGRESION MULTIPLE:

Existen diferentes modelos de regresión múltiple, pero uno de los que tiene
más uso es el modelo lineal. Cuando la variable respuesta o dependiente de un
modelo probabilístico está en función de dos o más variables se dice que es un

modelo de regresión múltiple, esto es:

y = f(x1, x2, ...,xn) + ε .

Regresión múltiple lineal.

Modelo probabilístico: Modelo determinístico:

y =a1x1 +a2x2 +...+anxn +b+∈ yˆ = aˆ1 x1 + aˆ 2 x 2 + ... + aˆ n x n

Todo modelo de regresión simple puede representarse en el plano


Cartessiano (bidimensional) puesto que se requiere de un eje para representar la
variable independiente (x) y otro para las observaciones (y). Para el caso de
regresión múltiple solamente hay una representación espacial, cuando se tienen
dos ejes para las variables independientes (x1 y x2) y otro para las observaciones
(y), es decir, modelos de la forma y = f(x1, x2). Ver gráfica.
y
En el espacio la ecuación de
regresión, viene dada por
un plano
Plano de
regresió
n

x2

x1

Para modelos donde el número de variables independientes es igual o mayor que 3,


es imposible realizar una representación gráfica, No obstante la ecuación de
regresión se le llama hiperplano.
BIBLIOGRAFIA

1. ARVELO, Francisco. 525 Problemas. Probabilidad, Estadística, Matemática,


Control de Calidad. Ed. Litexto, Caracas.

2. ADAM, E. y EBERT, R.(199 Adminisración de la Producción y las


Operaciones. Prentice Hall, U.S.A.

3. AZORIN, Francisco.(1972) Curso de Muestreo y sus Aplicaciones. Aguilar


Madrid.

4. BOWXER, A. Lieberman (1986), G. Estadística para Ingenieros. Prentice


Hall, México.

5. COCHRAN, William (1964). Sampling Techhiques, John Wiley Sons.USA.

6. DELNU. Servicios Gerenciales S.R.L (1980). Prácticas de Control de


Calidad. Caracas.

7. DIAZ, Eduardo (1994). Aplicaciones Prácticas de la Estadística en el


Control de la Calidad. UNEG.

8. GARCIA, Silvio.(1989) Control Estadístico de la Calidad. Folleto Mocarpel,

9. GUERRA , J. y SEVILLA E.(1992) Introducción al análisis estadístico para


procesos. Habana.
10. ISHIKAWA, kaoru (1991). Qué es Control de Calidad. Norma.

11.KUME, Hitoshi.(1992) Herramientas Estadísticas Básicas para el


mejoramiento de la calidad. Editorial Norma. Colombia.

12. MENDENHALL, William (1997). Probabilidad Y Estadística para Ingeniería.


Prentice Hall.

13. MILLER, Irwin.(1986) Probabilidad y Estadística para Ingenieros. Irwin


México Prentice-hall Hispanoamericana.

Potrebbero piacerti anche