Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
DE MINITAB
MINITAB
CONCEPTOS BASICOS
INTRODUCCION
Minitab es un programa computacional del tipo estadístico que ha sido diseñado especialmente para
estudiantes e investigadores que no tengan necesariamente experiencia previa con computadores. Es
muy fácil de usar, flexible y bastante “poderoso”. Este programa estadístico ha sido diseñado para
trabajar con archivos de datos de tamaño moderado, los cuales pueden ser almacenados en la
memoria principal. Específicamente, Minitab es un conjunto de programas diseñados para ejecutar
distintos procedimientos estadísticos tales como: construir tablas y gráficos, calcular medidas de
tendencia central y de dispersión, tomar decisiones en base a la información dada por una o dos
muestras, efectuar análisis de la varianza, medir la correlación entre variables, efectuar análisis de
regresiones lineales, hacer análisis con series de tiempo, analizar tablas de contingencia, utilizar
métodos no paramétricos, efectuar análisis exploratorios de datos, presentar algunas distribuciones
de probabilidad y simular muestras sacadas de poblaciones conocidas.
Existen diferentes versiones de Minitab. Este manual ha sido elaborado para utilizar la versión
13.31 en inglés. En caso de requerirlo, este programa cuenta con una página en la red cuya dirección
es www.minitab.com. En esta página se puede encontrar información general sobre el producto,
actualización de versiones. Además, en esta página usted puede tener acceso a un DEMO, el cual
puede ser bajado de la red. Este programa le permite instalar Minitab en su computador para tenerlo
activo durante 30 días. Viene con documentación en línea y trae también un programa de ejercicios
para estudiantes.
Los requerimientos del sistema son los siguientes: Processor: Personal computer with a 486 or
higher processor; math coprocessor required with 486 processor. Memory: 16 MB of RAM Disk
Space: 40 MB hard disk space Operating System: Windows 95/98/ME/NT/2000, or XP Display:
VGA or SVGA monitor, minimum 800x600 recommended Mouse required for some capabilities. This
product does not run under Windows 3.x or Windows NT 3.51.
Elaborado por C. Espoz 3
MINITAB
AMBIENTE DE TRABAJO
2. Haga clic en el icono que aparece en el cuadro de la esquina superior derecha de la pantalla
Maximizar la pantalla
Cerrar
Minimizar
Elaborado por C. Espoz 4
EL AMBIENTE Minitab
Para realizar un análisis de datos, usted cuenta con una serie de ventanas y herramientas. Abajo
aparece una figura donde se muestran las principales ventanas del ambiente Minitab.
Barra de herramientas
Barra de
menú
Ventana
de sesión
Project
manager
Ventana Ventana de
de datos Gráficos
Barra de
estado
Minitab tiene 9 menús desplegables diferentes cada uno de los cuales contiene una variedad de
opciones más los submenús que contienen algunos menús principales. Los menús son, de derecha a
izquierda (según aparecen en la ventana de Minitab):
Ø Para acceder a las opciones que ofrece cada menú basta con hacer un clic con el botón
izquierdo del ratón sobre el menú que desea abrir.
Ø Alternativamente, usted puede presionar la tecla ALT y la letra que aparece subrayada en el
menú de interés.
File
Edit
§ Este menú es principalmente para editar los datos.
§ Hay opciones para cortar, copiar, pegar y borrar datos desde las
celdas de la Ventana de Datos o texto de la Ventana de Trabajo.
§ El menú Edit también tiene la opción de Deshacer, el cual puede ser
usado para deshacer acciones previas (incorrectas).
Elaborado por C. Espoz 6
Manip
§ Este menú entrega opciones para ordenar y sortear datos.
§ Adicionalmente, hay opciones para borrar filas, eliminar variables y copiar
columnas.
§ Quizás la opción más útil de este menú es la de codificar los valores (Code
Data Values). Esta opción permite volver a codificar los valores. Por ejemplo,
con esta opción es posible crear una variable categórica desde una variable
que se presenta en intervalos (e.g. grupos de edad desde valores crudos de
edad).
Calc
§ Las opciones en el menú Calc crean variables aleatorias según las
distribuciones estadísticas y distribuciones de densidad probabilísticas
seleccionadas.
§ Las estadísticas de filas y columnas son particularmente útiles para
chequear qué tan libre de errores están los datos ingresados.
Stat
§ Este menú entrega la mayoría de las opciones
estadísticas de Minitab.
§ Para un análisis estadístico preliminar, las
opciones de Estadísticas Básicas (Basic Statistics)
y Tablas (Tables) serán de particular interés. En
ambos casos, se nota una pequeña flecha a la
derecha de cada opción del menú. Esta flecha
indica que habrá más menús desplegables
(submenús) los que entregan opciones adicionales.
Elaborado por C. Espoz 7
Graph (Gráficos)
§ Este menú entrega opciones para crear gráficos en 2D y 3D tales gráficos estándar de negocios,
gráficos tipos como gráficos de barras, de pie (torta), histogramas, de tipo científico como
scatterplots (del análisis de regresión), gráficos de series de tiempo, gráficos de contornos y
superficie.
§ Los gráficos pueden ser de alta resolución los que pueden ser vistos en una pantalla de alta
resolución e impresos en una impresora láser, o pueden ser gráficos de caracteres, útiles para
impresoras de líneas o puntos.
Editor
§ Este menú entrega opciones para ser usadas con el editor de Minitab para
entrar comandos que antiguamente se ingresaban escribiendo en la línea de
comandos.
§ Es aquí donde usted define el formato de las columnas.
§ También en este menú hay opciones generales relacionadas con la hoja de
cálculo y las características del portapapeles.
Window
§ Este menú entrega opciones para controlar las actividades de la ventana.
§ Es particularmente útil para moverse entre ventanas, en especial entre las
ventanas de Datos y de Trabajo.
§ Aquí se ve la otra ventana que Minitab tiene por defecto, la ventana Project
Manager.
Help
Quizás es el menú más práctico de todos los menús. Este menú entrega ayuda sobre todos los
comandos y opciones de Minitab.
PROJECT MANAGER
Las nuevas versiones poseen una ventana que se denomina Project Manager que contiene carpetas
que le permiten navegar, ver y manipular diferentes partes de su proyecto. Al hacer un clic con el
botón derecho del ratón en cualquiera de las carpetas o en los contenidos de estas carpetas usted
podrá tener acceso a una variedad de menús que le permitirán manejar los resultados de la ventana
de trabajo, gráficos, hojas de cálculo, lenguaje de comandos, y áreas relacionadas.
Carpeta de sesión
Carpeta de historia
Carpeta de gráficos
Carpeta de documentos
CARPETAS DISPONIBLES
v Lo mejor para ingresar datos es maximizar la Ventana de Datos. De esta forma usted podrá ver el
máximo posible de sus datos.
ACTIVIDAD Nº1
Antes de proceder con el ingreso de datos, genere una carpeta personal en el escritorio de cada
computador (ésta será la carpeta dónde usted guarde todos los trabajos que realice durante el curso).
Para esto siga las siguientes instrucciones:
Elaborado por C. Espoz 12
1. Minimice la pantalla de Minitab. Con esto el cursor deberá quedar posicionado sobre el
ESCRITORIO.
Primero, maximice la pantalla de Minitab haciendo clic en el botón correspondiente desde la barra
de tareas (parte inferior de la pantalla).
v Para trabajar en la ventana de datos es buena idea MAXIMIZAR la pantalla. Hágalo ahora.
Elaborado por C. Espoz 13
Ingrese el siguiente grupo de datos. La primera columna representa la especie de árbol frutal y la
segunda corresponde a la frecuencia absoluta.
Arbol fi
Peral 45
Manzano 65
Naranjo 78
Mandarino 3
Pomelo 23
Ingrese el nombre
de las variables
v Para asegurarse que el archivo quedó donde usted quería, minimice la pantalla de Minitab y
verifique en su escritorio haciendo dos clic en la carpeta generada previamente .
v CIERRE SU HOJA DE CALCULO
§ La hoja de cálculo (WORKSHEET) corresponde a datos que han sido previamente ingresados y
guardados en un archivo.
§ Este archivo contiene sólo datos y nombres de variables.
§ En una hoja de cálculo no hay gráficos, resúmenes estadísticos o análisis.
Elaborado por C. Espoz 15
Otra forma de traspasar datos desde una planilla a otra es a través del uso de las teclas CORTAR (o
COPIAR) Y PEGAR
Arbol hi
Peral 0.21
Manzano 0.304
Naranjo 0.364
Mandarino 0.014
Pomelo 0.107
§ Cuando haya terminado de ingresar los datos, seleccione el área desde peral hasta la frecuencia
0.107.
§ Para esto , presione el botón izquierdo del ratón y sin soltar marque las celdas que desea copiar.
Una vez que tenga el área seleccionada suelte el botón.
§ Haga clic en el botón derecho del ratón.
§ Aparecerá el siguiente cuadro de diálogo:
§ Selecciones con el botón izquierdo del ratón COPIAR
§ Luego, minimice la pantalla Excel y Maximice la pantalla de Minitab
§ Ya en Minitab, ASEGÚRESE que:
a. La Ventana de Datos esté activa y maximizada
b. Dentro de la ventana de datos esté activa la hoja de cálculo creada
con los datos ingresados manualmente
Elaborado por C. Espoz 17
§ Ubíquese en la tercera columna (C3) y haga clic en el botón derecho del ratón
§ Presione el botón PEGAR
§ Preocúpese de guardar los cambios realizados.
Ahora, como tiene una columna que se repite (especie de frutal) ELIMINE la columna que aparece
en C3. Para esto,
a. Utilice los menús desplegables que surgen al apretar el botón DERECHO del ratón
b. O utilice los submenús que aparecen en el menú EDIT
v Recuerde guardar los cambios realizados en su hoja de cálculo.
Ventana de Sesión
Todos los comentarios y todo el trabajo estadístico, diferentes de los gráficos de alta resolución,
aparecerán en la ventana de sesión. Mientras esta ventana esté activa, usted podrá editar sus
contenidos tal como si estuviera en un procesador de texto para así posteriormente imprimir la
información. Los comandos para editar (retroceso, borrar, Cortar/copiar/pegar) trabajan
exactamente igual que en la mayoría de los procesadores de texto.
Después de ingresar manualmente los datos, la ventana de sesión permanece vacía. Sin
embargo, si una hoja de cálculo existente es abierta, la ventana de sesión contendrá un mensaje
relacionado con este archivo de datos. Usted puede borrar este mensaje antes de continuar.
Por ejemplo, borre todo el texto que aparece en la venta de sesión, excepto la fecha/hora.
• Primero, active la ventana de sesión haciendo clic en cualquier parte de ésta
• Luego, m arque el texto que desea borrar (con el ratón)
• Haga clic en EDIT > DELETE desde la barra de menú o simplemente usando la tecla BORRAR
• Escriba su nombre en la línea bajo la fecha/hora y escriba "Introducción a Minitab"
v Su ventana de sesión será guardada con el nombre que usted especifique y MINITAB asignará
la extensión .TXT
v Infortunadamente, el proceso anterior destruye el formato. Por lo tanto, una mejor forma para
acceder a la info rmación contenida en la ventana de sesión es simplemente a través de
COPIAR/PEGAR De esta forma el formato será preservado.
Elaborado por C. Espoz 20
MINITAB
REPRESENTACIÓN GRÁFICA
Layout
§ Le permite especificar si uno o varios gráficos de alta resolución aparecerán en una sola página.
Cuando usted hace clic en OK en el cuadro de diálogo Layout, Minitab entra al modo Layout, y
envía cada gráfico que usted cree en una sola página.
§ Cuando usted ha creado todos los gráficos que quiere, despliegue la página eligiendo
Graph > End Layout
Plot
§ Produce un gráfico de puntos que muestra la relación entre dos niveles de dos variables.
Elaborado por C. Espoz 21
§ Produce un gráfico
de series de tiempo
con el tiempo en el
eje X y la columna
especificada en el
eje Y.
Chart (Caracteres)
§ Produce diferentes
tipos de gráficos de
negocios, incluyendo
gráfico de barras,
gráfico de líneas,
gráfico de símbolos y
gráficos de áreas.
Elaborado por C. Espoz 22
Histogram
§ Aquí se produce un histograma. Tal como los gráficos de caracteres, los histogramas muestran
barras para cada grupo en el eje X.
§ En el caso de histogramas, los grupos corresponden a intervalos de datos continuos. Por ejemplo,
todos los valores entre 0.5 y 1.5 podrían ser agrupados en un intervalo llamado "1", todos los
valores entre 1.5 y 2.5 podrían ser agrupados en un intervalo llamado "2", etc.
Boxplot
Produce un gráfico de "cajas". El gráfico de cajas por defecto consiste en una caja, variación
("whiskers") y puntos extraños
("ourliers"). Minitab dibuja una línea a
través de la caja que representa la
mediana. La parte inferior de la caja
representa el primer cuartil y la parte
superior el tercer cuartil.
Contour Plot
Un gráfico de contorno es un gráfico bi-dimensional de las medidas de 3 variables. Se puede pensar
en una tercera (variable z) como la extensión fuera o dentro de un plano.
Elaborado por C. Espoz 23
3D Plot
Produce gráficos de puntos en 3 dimensiones.
3D Wireframe Plot
Esta caja de diálogo genera un gráfico en 3 dimensiones de una superficie para una variable z basado
en una malla determinada por las variables x e y.
3D Surface Plot
Aquí se genera un gráfico en 3 dimensiones de la superficie de una variable z basado en una malla
determinada por las variables x e y.
Dot Plot
Se despliega un punto para cada observación a lo largo de una línea de números. Si hay ocurrencias
múltiples de una observación, o si las observaciones están muy cerca unas de otras, entonces los
puntos se podrán verticalmente. Si hay muchos puntos para ajustar verticalmente en el gráfico,
entonces cada punto puede representar más de un punto. En este caso, un mensaje aparecerá sobre el
gráfico deno tando el máximo de observaciones que representan los puntos.
Marginal Plot¡
Es un gráfico de puntos con gráficos en los márgenes de los ejes x y/o y que muestran la distribución
de los puntos en cada dirección, o las distribuciones marginales muestrales. Usted puede elegir
histogramas, gráficos de cajas o de puntos como los gráficos marginales.
Probability Plot
Use este gráfico para medir lo que se ajusta una distribución particular a sus datos.
Character Graphs
Minitab despliega gráficos de caracteres en la ventana de trabajo. Ellos consisten en gráfico claves
que no son de alta resolución. Si usted quiere que sus gráficos sean parte de un archivo ASCII donde
estén contenidos tanto los gráficos como el registro de su sesión de trabajo, use los gráficos de
caracteres. Todas las impresoras pueden manipular gráficos de caracteres. Estos gráficos también
pueden trabajar bien con sistemas de correo electrónico.
Algunos comandos de los gráficos de caracteres tienen los mismos comandos que sus
contrapartes de alta resolución. Debido a lo anterior, Minitab tiene dos modos gráficos: Alta
resolución o Modo profesional (GPRO), el modo por defecto, y el modo estándar (GSTD), para
gráficos de caracteres. Usted puede descartar estos modos cuando usted usa los menús para acceder
a estos comandos o si usted sólo usa gráficos de alta resolución.
Elaborado por C. Espoz 25
ACTIVIDAD Nº1
h. Luego,
§ Haga 2 clic en el gráfico
§ Aparecerán dos barras de herramientas que le permitirán hacer cambios en la apariencia de su
gráfico
§ Por ejemplo, Inserte un título en su gráfico.
§ Para esto utilice la herramienta que aparece dentro del círculo
§ Luego, cambie los títulos de los ejes X e Y haciendo 2 clic sobre los nombres que
aparecen por defecto
§ Una vez que termine con los cambios preocúpese de GUARDAR su gráfico en la
carpeta matriz (aquella que generó la primera sesión en su escritorio). esto se hace siguiendo las
siguientes instrucciones: File > Save Graph As ...
Elaborado por C. Espoz 26
Con los datos que aparecen a continuación genere un gráfico con las frecuencias absolutas (fi) y otro
gráfico con las frecuencias relativas (hi).
Raza fi hi (%)
Pastor alemán 38 31.
Doberman 12 10
Labrador 3 2.5
Pekinés 44 36.7
Poodle 23 19.1
Total 120 100
3. Gráfico circular
v Note que en este caso no fue necesario calcular la frecuencia relativa. Minitab lo hizo por usted
a partir de las frecuencias absolutas.
Elaborado por C. Espoz 28
Sexo H H H M M H H M M M H H H H H H H M H
Edad 22 23 22 24 21 22 21 19 25 22 20 22 21 19 24 23 19 26 18
Para tabular los datos necesitamos generar, por ejemplo, 3 categorías (1, 2 y 3) para los intervalos 18-
20, 21-23 y 24-26 años.
Corresponde a la
asignación de las
categorías
§ El primer cuadro, CODE DATA FROM COLUMNS, le pregunta por la columna en donde tiene
los datos que debiera cambiar. Ingrese la columna adecuada.
§ El siguiente cuadro, le pregunta por la(s) columna(s) donde quiere almacenar las nuevas
categorías (INTO COLUMNS). Ingrese aquí la columna correspondiente (C3).
Elaborado por C. Espoz 29
§ Finalmente, los cuadros restantes le preguntan por instrucciones para asignar los valores
originales dentro de categorías. El valor original 18:20 será la categoría 1, 21:23 la categoría 2 y
24:26 la tercera categoría. Realice manualmente la operación de ingreso de datos. Una vez que
haya terminado haga un clic en OK.
Para graficar las categorías recién creadas siga las siguientes instrucciones:
GRAPH > Pie Chart
§ Aparecerá el siguiente cuadro de diálogo
4. Histograma
Para realizar el histograma se debe tener una serie de valores individuales. Utilice para este ejercicio
el archivo sexo.mtw
En Options:
§ Elija Frecuency para Type of Histogram
§ Para Type of Intervals elija Midpoint que corresponde a la marca de clase)
v Recuerde guardar tanto los datos como el histograma que generó en su carpeta matriz.
Elaborado por C. Espoz 31
MINITAB
ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva es utilizada para presentar y describir conjuntos de datos con el objeto de
facilitar la comprensión de la información que contienen dichos datos.
Este documento explica cómo usar Minitab para computar estadística descriptiva de una serie de
datos. Básicamente, medidas de tendencia central y de dispersión.
Procedimiento General
1. Para desplegar estadísticos básicos tales como tamaño de la muestra, media, mediana, desviación
estándar, TrMean, SEMean, Q1 y Q3, max, min, etc
§ Ingrese los datos en una columna, por ejemplo C1. Nombre la columna como a usted le parezca
§ Seleccione Stat > Basic Statistics > Display Descriptive Statistics
§ En el cuadro de diálogo que aparecerá, la lista de variables a ser analizadas se encuentra a la
izquierda
§ Haga doble clic en el nombre de la variable para que ésta ingrese en el cuadro de Variables (la
otra posibilidad es ingresar el número de la columna en el cuadro de Variables)
§ Luego haga clic en OK
2. Para encontrar la MODA de los datos en la columna C1, use el conteo de frecuencias a través del
procedimiento TALLY, tal como sigue:
Actividad Nº1
Para cada uno de los ejercicios que aparecen a continuación, use Minitab para responder las
preguntas. NOTA: Use las tres columnas C1 y C2 para ingresar los datos en los tres ejercicios.
Cuando haya terminado, guarde su trabajo en un archivo.
(*)TrMean corresponde a la media después de remover los datos extremos al 5%. Esto tiende a
remover el efecto del sesgo de los "outliers" (Gráficos del tipo Boxplots son útiles para definir la
existencia de "outliers"), mientras que SEMean es el error estándar de la media.
99 88 69 90 90 75 88 69 62 72 69 70 91 20 81 78 73 81 84 61 92 88 89 90 98 55 88 68 82 82 61 80 94 40 80 88
83 59 72 45 92 78 90 92 89 51 75 65 72 90 82 74 69 55 86 94 99 72 75 95
Elaborado por C. Espoz 33
Ejercicio 2. En un experimento, se registró el tiempo (en segundos) que demora una rata en subir
una escalera. Se entregan los resultados para 10 ratas:
4.9 7.7 7.9 6.9 6.6 6.6 5.5 5.1 5.2 6.8
Actividad Nº2
Se entregan los puntajes obtenidos en el primer examen de los estudiantes de una clase de Estadística
por sexo, donde 1= hombre y 2 = mujer.
Ejercicio 3. Para desplegar los estadísticos básicos de los puntajes en C1, proceda como sigue:
§ Seleccione Stat > Basic Statistics > Display Descriptive Statistics
§ La lista de variables a ser analizadas se encuentra a la izquierda en el cuadro de diálogo que
aparece
Elaborado por C. Espoz 34
§ Haga doble clic en la variable PUNTAJE para que esta variable ingrese en el cuadro de Variables
(la otra posibilidad es ingresar el número de la columna en el cuadro de Variables)
§ Luego haga clic en OK
Ejercicio 4. Suponga que ahora quiere computar y comparar los estadísticos básicos SEGÚN EL
SEXO DE LOS ESTUDIANTES.
Actividad 3.
Investigue de qué le sirven los gráficos que aparecen detallados más abajo. Todos ellos aparecen
como opción cuando usted está en la ventana de:
Basic Statistics> Display Basic Statistics > Graphs
• Histograma
• Histograma con Curva Normal
• Boxplot
• Resumen Gráfico (Graphical summary)
Utilice la siguiente serie de datos que representan las alturas de los estudiantes de Bioestadística del
primer semestre de 2003.
Elaborado por C. Espoz 35
Este tipo de gráficos es útil para detectar datos "anormales" o "extraños" que pueden afectar la
tendencia general de los datos. Aquí se explica como usar Minitab para construir un gráfico tipo
Boxplots.
§ Seleccione Graph > Boxplot
§ Luego complete el cuadro de diálogo que aparece
§ Bajo la variable Y, y al lado del 1 que define al gráfico ingrese C1
§ Luego haga clic en OK
v Interprete el gráfico a la luz de los resultados obtenidos en el ejercicio anterior.
NOTA: Por defecto Minitab entrega el gráfico verticalmente. Para decirle a Minitab que el gráfico lo
ubique horizontalmente siga las siguientes instrucciones:
§ Seleccione Graph > Boxplot
§ Luego complete el cuadro de diálogo
§ Bajo la variable Y, y al lado del 1 (que corresponde al número de gráfico) ingrese C1
§ Haga clic en Options y llene la información requerida
§ Seleccione Transpose X and Y
§ Haga doble clic
Elaborado por C. Espoz 36
MINITAB
DISTRIBUCIÓN NORMAL
1. Distribución Normal
1.1. Suponga que usted quiere computar la probabilidad acumulada para el valor 27 desde una
distribución normal con media = 28 y desviación = 1. Usted estará buscando el área bajo la curva
a la izquierda de 27. Para obtener la probabilidad:
1.2. Para encontrar el área bajo la curva normal estándar a la izquierda de algún valor Z (curva
normal estándar)
v Los resultados representan las probabilidades (áreas bajo la curva normal estándar)
Ejercicio Nº 1.
La distribución de los pesos de una población de cerdos A es normal con media 90 y varianza 64 y la
de otra población de cerdos B es normal con media 88 y varianza 81. ¿En cuál de las 2 poblaciones es
más probable encontrar un cerdo que pese menos de 82 Kg?
NOTA: Para encontrar el área bajo cualquier curva normal a la izquierda de algún valor de X, siga el
mismo procedimiento anterior pero en el cuadro de la media y desviación estándar reemplace por la
media y desviación poblacional. El valor puntual se ingresa en Input Constant
Ejercicio.
Se quiere saber si los datos que representan los resultados del examen de los 60 postulantes al
Departamento de Ciencias Básicas siguen una distribución normal (Actividad Nº3).
§ Grafique los datos en un HISTOGRAMA
§ Vea si estos datos siguen una distribución normal. Apreciación visual.
§ Siga el procedimiento descrito arriba y aplique una prueba de normalidad.
Elaborado por C. Espoz 38
MINITAB
DISTRIBUCIONES POBLACIONALES Y MUESTRALES
Actividad 1.
Actividad 2.
Desde su población extraiga una muestra aleatoria de tamaño igual a 5 estudiantes y con los datos
que le entrega la muestra:
v Estime en forma puntual la media y la varianza poblacional de la altura de los estudiantes del
curso de Bioestadística sección 1.
v ¿La media muestral es normal? Grafique para responder esta pregunta.
Actividad 3.
Extraiga ahora una muestra aleatoria de mayor tamaño (n = 30 estudiantes). Con los datos de esta
muestra:
v Estime en forma puntual la media y la varianza poblacional de la altura de los estudiantes del
curso de Bioestadística sección 1
v ¿La media muestral es normal? Utilice una representación gráfica para responder esta pregunta.
Elaborado por C. Espoz 41
MINITAB
INTERVALOS DE CONFIANZA
El objetivo de esta actividad es utilizar el programa Minitab para calcular los límites de confianza,
para medias de distintas muestras.
Procedimiento General
1. Primero hay que contar con un archivo de datos. En esta ocasión utilizaremos el archivo
EXH_STST.MTW ubicado en C:\ Archivos de Programa \ Mtbwin \ Data
NOTA: Las medidas que aparecen en la primera columna corresponden a los pesos corporales de 9
aves de una especie desconocida. Se sabe que la distribución de estas medidas es normal con σ = 0.2.
Elaborado por C. Espoz 42
Actividad 1.
Procedimiento
Actividad 2.
Imaginase que desconoce la varianza poblacional y lo único que sabe es que la población se
distribuye normal. ¿Qué haría para estimar el intervalo de confianza de la media poblacional?
Procedimiento t de Student.
MINITAB
PRUEBA DE INDEPENDENCIA CHI CUADRADO
Ejercicio 1. Un estudiante busca tomar un curso de Estadística con un profesor que evalúe
positivamente a sus alumnos. Existen 3 profesores que podrían dictar el curso el semestre que viene.
El estudiante obtiene una muestra aleatoria de las calificaciones dadas por estos profesores el
semestre pasado.
Profesor
#1 #2 #3
A 10 12 28
Calificación B 15 30 25
C 35 30 15
Usando un nivel de significancia del 1%, pruebe la hipótesis que la calificación de los estudiantes el
semestre pasado fue independiente del profesor.
Procedimiento:
1. (Opcional) Nombre las columnas C1, C2, C3, C4 como: Calificación, #1, #2, #3, respectivamente
2. (Opcional) Ingrese las calificaciones A, B, C en C1
Elaborado por C. Espoz 45
Ejercicio 2. Suponga que está interesado en la conexión que existe entre género (hombre y mujer) con
las preferencias políticas en EEUU. Se toma una muestra de 100 personas y se les consulta respecto
de su afiliación política. El número de hombres (fila 1) y mujeres (fila 2)por partido político aparece
en la siguiente tabla.
NOTA 1: El valor de p indica si hay o no evidencia suficiente para rechazar la hipótesis nula de
independencia. Con valores de p 0.05 se rechaza la hipótesis nula de independencia.
NOTA 2: En el segundo ejercicio note que existen dos de las seis celdas con conteos esperados
menores a 5.0. Por consiguiente, aun cuando hubiera un valor de p significativo hay que interpretar
los resultados con precaución.
1. Ingrese en la columna C1, el área(s) a la izquierda del valor de Chi Cuadrado que usted quiere
encontrar.
Elaborado por C. Espoz 46
Ejercicio 4. Asuma 17 grados de libertad. Encuentre el área a la izquierda de los siguientes valores de
Chi Cuadrado: 6, 32.8, 14.01, 20.
Procedimiento
a la media poblacional
4. Haga clic en OK
Interpretación:
estadística por azar si la hipótesis nula fuera verdadera es 0.002. Se llama el nivel de significancia.
• Puesto que el valor de p es 0.002 hay evidencia suficiente (o significante) que indica que la media
poblacional no es igual a 5, tal que se rechaza H 0 (Hipótesis de igualdad) con un 90% de confianza.
Elaborado por C. Espoz 48
Ejercicio 2. Ponga a prueba si la media de la población es mayor que 5. En este ejercicio, usted debe
asumir que desconoce la varianza poblacional. Para esto, utilice el procedimiento t de Student.
Procedimiento
para el cálculo
la media poblacional
hipótesis alternativa)
4. Haga clic en OK
MINITAB
ANÁLISIS DE VARIANZA
Ingreso de Datos
Ingrese los siguientes datos. Estos datos corresponden a cuadrantes ocupados por especie de
patelogastrópodos (i.e, invertebrados marinos) en el nivel intermareal alto, medio y bajo. En este caso
los datos han sido reagrupados (en relación a la actividad práctica donde se definió los límites de
confianza). La primera variable es la especie de patelogastrópodo, la segunda es el nivel intermareal
donde 1 = nivel alto; 2 = nivel medio y 3 = nivel bajo. La tercera columna corresponde a la variable
respuesta que en este caso es el número de cuadrantes ocupados por especie de patelogastrópodo.
Elaborado por C. Espoz 50
Especie NivelCuadrante
variabilis 1 10
viridula 1 20
zebrina 1 26
plana 1 30
ceciliana 1 52
scurra 1 70
araucana 1 65
variabilis 2 98
viridula 2 15
zebrina 2 27
plana 2 10
ceciliana 2 375
scurra 2 20
araucana 2 111
variabilis 3 89
viridula 3 40
zebrina 3 3
plana 3 134
ceciliana 3 141
scurra 3 293
araucana 3 62
Análisis de Varianza
El análisis de varianza (ANOVA) de Minitab incluye procedimientos para ajustar modelos de
ANOVA a datos recolectados desde diferentes diseños, para ajustar modelos de MANOVA para
diseñar respuestas múltiples, para ajustar ANOM (análisis de medias), y especialmente cuenta con
gráficos para probar igualdad de varianzas, barras de error o gráficos de intervalos de confianza,
gráficos de efectos principales e interacciones.
Análisis de una vía: análisis de varianza con la variable respuesta en una columna, subscritos en otra
columna. Aquí se pueden realizar comparaciones múltiples de medias.
Elaborado por C. Espoz 51
Análisis de una vía (Unstacked): análisis de varianza con cada grupo en una columna separada
Dos vías: análisis de varianza de dos vías con datos balanceados.
Análisis de medias: despliega un gráfico de análisis de medias e imprime una tabla resumen para
datos con distribución normal, binomial y Poisson.,
ANOVA Balanceada: analiza modelos de ANOVA balanceados cruzados o anidados, con factores
fijos o aleatorios.
Modelo Lineal General: analiza modelos de ANOVA balanceados o no balanceados cruzados o
anidados con factores fijos o aleatorios y covariados. Además diseña comparaciones múltiples de
medias.
ANOVA Completamente Anidado: analiza modelos de ANOVA completamente anidados y estima
los componentes de la varianza.
Prueba para Igualdad de Varianzas: Pruebas de Bartlett y Levene para probar igualdad de
varianzas.
Gráfico de Intervalos: entrega gráficos que muestran la variación de las medias de grupos al graficar
las barras de error estándar y los intervalos de confianza.
Gráfico de los Efectos Principales: genera un gráfico de los efectos principales.
Gráfico de las Interacciones: genera un gráfico que sirve para evaluar la existencia de interacciones
entre los factores.
Ejercicios
1. Establezca si hay diferencias entre el número de cuadrantes ocupados promedio por nivel
intermareal
2. En función de los resultados que aparecen en la ventana de trabajo construya su tabla de
ANOVA
Elaborado por C. Espoz 52
MINITAB
CORRELACIÓN
En una investigación para determinar el efecto del tiempo de estudio, se seleccionó aleatoriamente 25
estudiantes a los cuales se les aplicó una prueba. A continuación se entregan el número de horas que
ellos estudiaron y el puntaje que sacaron en la prueba.
La primera forma de examinar la relación entre estas dos variables es calcular el coeficiente de
correlación r.
Elaborado por C. Espoz 54
Procedimiento
Para establecer la relación que existe entre las horas de estudio y el puntaje obtenido en una prueba,
lo primero que debe hacer es poner todas las “horas de estudio” en la columna 1 (C1). Después de lo
cual debe poner todos los puntajes en la columna 2 (C2).
Luego, para acceder a los procedimientos que tienen que ver con la búsqueda del coeficiente de
correlación r utilice:
STAT > BASIC STATISTICS > CORRELATION
En el cuadro de diálogo que aparece debe colocar las variables cuya relación quiere definir.
Para eso debe hacer doble clic en C1 y C2 (horas y puntaje respectivamente), para terminar con un
clic en OK.
Después de esto, en la ventana de sesión, aparecerán sus resultados. La fórmula que u tiliza Minitab
para calcular la correlación entre 2 variables es exactamente la misma que se vio en clases.
Correlations (Pearson)
Correlación entre Horas y Puntaje =
Interpretación:
De acuerdo con los resultados r = _____. Esto quiere decir que la correlación es igual a __________.
¿Qué significa que r sea distinto, mayor o menor que 1? ¿Por qué 1?. Esquematice su respuesta.
Nota: En el caso que los datos estén en escala ordinal será necesario el cálculo del coeficiente de
correlación de rangos de Spearman (rs). Puesto que Minitab no incluye un procedimiento específico
para el cálculo de este coeficiente lo que se puede hacer es ranquear las columnas:
MANIP > RANK
y luego usar CORRELATION de las columnas ranqueadas. Hay que recordar que con este
procedimiento lo que estamos haciendo es medir la correspondencia entre rangos y no
necesariamente se está midiendo la correlación lineal.
Por otra parte, podemos examinar la relación a través de la representación gráfica de los datos,
ordenados por pares (x,y), recordando que existen problemas asociados con la escala de observación
Elaborado por C. Espoz 55
(visto en clases). Para hacer esto utiliza la siguiente combinación del menú:
GRAPH > PLOT
Esta combinación producirá un cuadro de diálogo similar al que sigue:
Entre C2 (puntaje) bajo Y (la flecha dibujada a la izquierda) y entre C1 bajo X (horas de estudio) (la
flecha dibujada a la derecha), luego haga un clic en OK. Lo que va a obtener es un gráfico de las
horas de estudio versus el puntaje.
Note que el “puntaje” corresponde a la variable dependiente (Y) y la variable “horas de estudio” a la
variable independiente (X).
*** ¿Cómo se vería una relación: (1) positiva, (2) negativa y la situación donde (3) no hay relación
entre 2 variables? ***
Ejercicio 1. Los datos que se entregan a continuación corresponden al flujo de agua de un estero
medido a distintas profundidades (en cm). ¿Existe una relación entre ambas variables?. Primero
utilice una aproximación gráfica y luego calcule el coeficiente de correlación de Pearson. Interprete.
Flujo 0.353 0.320 0.219 0.179 0.160 0.113 0.043 0.095 0.278
Profundida 0.71 0.72 0.64 0.64 0.67 0.61 0.56 0.73 0.72
d
Prueba de Hipótesis
Si 2 variables no están correlacionadas entonces ρ=0 y en este caso es importante decidir si hay o no
probabilidad de que los datos de la muestra provengan de una población en la que ρ=0.
En consecuencia tendremos:
H 0: ρ = 0
H 1: ρ ≠ 0
Y si se hacen las suposiciones necesarias (señaladas en la clase) y si ρ=0 podemos demostrar
que:
Ejercicio 2.
En un estudio preparado para investigar la relación existente entre la creatividad y otras variables,
un equipo de psicólogos administró a una muestra aleatoria de 20 estudiantes una prueba para
medir el nivel de creatividad. Los investigadores solicitaron a cada estudiante que memorizaran un
poema corto. La tabla muestra los puntajes obtenidos por los estudiantes en la prueba de creatividad
y los puntajes que indican su habilidad en la memorización del poema. A partir de estos datos
construye un intervalo de confianza al 95% y pon a prueba la H0 : δ = 0 con el mismo nivel de
significancia anterior. Incluya en el desarrollo de este ejemplo: la definición de las hipótesis
estadísticas, cálculo de t (o de z) y la obtención del t tabla (o Z tabla ) y la conclusión a la que llega.
y: puntajes de creatividad
x: puntajes de memorización
x 13 85 27 69 76 30 39 32 13 58 84 27 56 49 88 79 51 37 24 59
y 11 96 15 88 92 34 44 67 37 38 78 27 71 75 89 60 41 28 56 54
Elaborado por C. Espoz 58
MINITAB
ANÁLISIS DE REGRESIÓN SIMPLE
En una investigación para determinar el efecto del tiempo de estudio, se seleccionó aleatoriamente 25
estudiantes a los cuales se les aplicó una prueba. A continuación se entregan el número de horas que
ellos estudiaron y el puntaje que sacaron en la prueba.
La pregunta que nos interesa responder es ¿cómo afectan las horas de estudios en el rendimiento de
una prueba (expresado como el puntaje obtenido en ésta)?.
Es posible hacer una primera aproximación al problema a través de la inspección ocular del gráfico
de las horas de estudio versus el puntaje obtenido. Para hacer esto, utilice la siguiente combinación
del menú (tal como lo hizo en la actividad práctica pasada):
GRAPH > PLOT
Entre C2 bajo Y (la flecha dibujada a la izquierda) y entre C1 bajo X (la flecha dibujada a la derecha),
luego haga un clic en OK. Lo que va a obtener es un gráfico de las horas de estudio versus el puntaje.
Del gráfico se desprende la existencia de una relación lineal, es decir el número de horas de estudio
afecta el puntaje que se obtuvo en la prueba. Más aún, es posible “ajustar” una línea recta que
relacione Y con X. Esta línea es la denominada como “Recta de la Regresión de Y e X” . Vemos aquí
como un modelo matemático simple nos provee de una descripción breve y precisa, el cual además
puede ser utilizado para predecir el puntaje a obtener en la prueba (Y) para un número determinado
de horas de estudio (X). Dado que el puntaje depende de la horas de estudio, el puntaje se denomina
“VARIABLE DEPENDIENTE O RESPUESTA” y como el número de horas de estudio NO
DEPENDE del puntaje, sino que es determinado por el estudiante se denomina “VARIABLE
EXPLICATIVA O REGRESORA”. La ecuación propuesta para esta regresión lineal simple es:
Y = α + βX + ε
donde:
Y = variable respuesta o dependiente; X = variable explicativa o regresora; ε = error aleatorio y
α, β = parámetros desconocidos
El criterio que permite estimar los parámetros α y β se denominan Mínimos Cuadrados Ordinarios
(MCO), el cual consiste en minimizar ∑(Yi- (α + βXi))2 con respecto a α y β (ver apuntes de clases).
Esto es, mediante este método se intenta minimizar la desviación del "total" de observaciones con
respecto a la línea recta (la más cercana posible a todos los puntos).
Elaborado por C. Espoz 60
La combinación del menú para ajustar esta línea en Minitab es como sigue:
STAT > REGRESSION > FITTED LINE PLOT
En el cuadro de diálogo que aparece, debe colocar su variable respuesta en el cuadro RESPONSE, y
la columna de la variable predictora en el cuadro PREDICTOR. También se pide la definición del
tipo de modelo de regresión que quiere utilizar (lineal, cuadrático o cúbico). Por defecto, el análisis se
hace con un 95% de confianza el que puede cambiar su presiona el botón Options.
Note que tanto la ecuación de regresión como el valor de r2 aparecen en el gráfico. Asimismo, puede
ver que también aparecen los puntos (datos originales), por lo que el gráfico inicial queda obsoleto.
Examinemos ahora la ecuación de regresión para este grupo de datos. Recuerde, que esta es la
ecuación de una línea recta que pasa “los más cercanamente posible a todos los puntos”.
Regression Analysis
Analysis of Variance
SOURCE DF SS MS F p
Regression
Error
Total (4)
Unusual observations
Interpretación:
(1) Ecuación de regresión estimada por MCO (α y β). Esto es, Y=b0 +b1 X
(2) Tabla de los coeficientes. La primera tabla que aparece en los resultados corresponde a los
coeficientes estimados (b 0 y b 1), cada uno de los cuales se muestra con su desviación estándar. Se
entrega también el valor de t para poner a prueba si el coeficiente es igual a 0, y el valor de p
asociada a esta prueba. La docimación corresponde a:
H 0 : α = 0 y H0 : β = 0, respectivamente
Elaborado por C. Espoz 62
(3) La desviación estándar estimada para la línea de regresión (s) es un estimador de σ. Nota que
s2=(CM Error).
R-sq (adj) (=R2 (adj)): R 2 ajustado o corregido por los grados de libertad. Este es un estimador
aproximadamente insesgado del R 2 poblacional y se calcula como:
Donde p es el número de coeficientes ajustados por la ecuación de regresión (en el ejemplo = 2). El
R2 usual se calcula de acuerdo a la siguiente fórmula:
R2 = 1- (SC Error/SC Total)
(4) Tabla de análisis de varianza. Esta tabla contiene las sumas de cuadrados (abreviadas SS). A veces
la SC Regresión aparece también como SC Modelo. SC Error también se escribe como SC Residual,
SCE (=SSE) y SCR (=RSS). La SC Total es la suma de cuadrados total corregida por la media. La
β=0. El test de significancia es F= CM Reg / CM
prueba que aparece aquí es para la hipótesis H 0:β
Error. El valor observado de F = _______ y muestra que una porción estadísticamente significativa
(p<0.05) de Y ha sido explicada por la regresión sobre X. (El coeficiente de determinación es el que
indica qué porcentaje de la variación de Y puede ser explicado por la variación de X).
(5) Muestra las observaciones que tienen residuos o errores muy grandes (posibles valores
anómalos) y las observaciones influyentes (aquellas que “pesan” mucho en la determinación de la
recta).
Finalmente, la ecuación de regresión encontrada (Puntaje = ____ + _____ Horas), nos permite
encontrar o predecir puntajes a obtener en la prueba dado un cierto número de horas de estudio. Por
ejemplo, si un alumno ha estudiado 10 horas, el puntaje predicho para la prueba sería de ____ +
Elaborado por C. Espoz 63
Precaución: hay que ser cuidadoso cuando se escogen los valores de la variable independiente que
servirán para predecir. Por ejemplo, ¿qué puntaje podría predecirse para un alumno que estudia 100
horas? 183.9, lo que es imposible. El problema aquí es que nuestra ecuación se basa en valores que
están muy lejos de 100 horas de estudio.