Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1. Introducción
2. Anatomía de la ventana principal
3. Dar nombre a una columna
4. Amplitud de una columna
5. Contenido de una celda
6. Ingreso de datos
7. Breve descripción de los comandos de la Barra de Menú
8. Comando File
9. Comando Edit
10. Comando Data
11. Comando Calc
12. Comando Stat
13. Comando Graph
14. Comando Editor>
1.Introducción
Una capacidad de manejo de datos muy potente que permite importar datos hacia un
proyecto, desde versiones anteriores, hojas de cálculo, bases de datos y archivos de
texto; enlace de datos hacia otras aplicaciones
No está demás resaltar el uso del Minitab en los problemas de Causa – Efecto y
también en la diversidad de aplicaciones que puede proporcionar en el Control de
Calidad.
En los últimos tiempos (diremos desde el inicio de los 90) la ciencia de la computación
en lo que a sistemas personales se refiere, se ha orientado a la programación orientada a
objetos y como consecuencia de ello aparecieron los lenguajes visuales; los que han
permitido el diseño y la construcción de programas muy grandes y complejos que
operan dentro de un escenario. Esto dio origen a los llamados espacios de
trabajo(escenario) los que se configuran dentro de lo que se conoce como proyectos.
Las últimas versiones del Minitab permite la construcción de proyectos para resolver
los problemas de proceso de datos. Un proyecto está formado por un conjunto de Hojas
de trabajo, de resultados almacenados en variables temporales, de gráficos a partir de
los datos almacenados en las hojas, de los enlaces entre una hoja u otras aplicaciones
externas y de la secuencia y ejecución de macros. En particular un proyecto está
formado por una o más Hojas de Trabajo.
Como es lógico, tanto los proyectos como las hojas de trabajo y los gráficos cuando de
almacenarlos se trata, deben tener un nombre y una extensión.
Los proyectos, hojas de trabajo y los gráficos se graban con el nombre que nosotros
deseamos. Estos nombres se distinguen por su extensión. En el caso de los proyectos la
extensión es MPJ. La extensión en el nombre de los archivos que son hojas de trabajo
es MTW, y en el caso de un gráfico es MGF.
Nota:
Si tiene el icono en el escritorio, haga doble clic en él. De otra manera debe usar la
siguiente secuencia: <Start> - <Programs> - <Minitab for Windows> - <Mintab>; si su
Sistema Operativo está en español:
La Barra de Menú: En ella se muestra los comandos que nos permite realizar todas
las operaciones con nuestros datos
La Barra de Herramientas: Muestra los iconos que nos permite la ejecución directa de una
serie de acciones para una parte o la totalidad de los datos y resultados.
Nota:
La hoja de trabajo del Minitab es como una hoja del Excel. Podemos ingresar datos,
seleccionar, copiar o pegar desde un bloque o rango de columnas hacia otro, como en el
caso del Excel. Pero se distinguirá de éste, en el sentido que las celdas almacenan sólo
datos, no fórmula. Los gráficos necesariamente se muestran en otra ventana, no sobre la
misma hoja. Y cuando existe una celda vacía, dentro de una columna de datos, se
mostrará un asterisco “*”, excepto si se ha modificado para otro simbolo.
En la figura anterior se aprecia las otras ventanas asociadas a una sesión de Mintab,
las que pasaremos a describirlas.
Ventana de Información: Contiene toda la información de las columnas de cada
una de las hojas del proyecto.
Observaciones:
Nosotros como usuario también podemos darle nombre a una columna. Para ello es
suficiente:
Ejemplo: En C1
3. Presionar <Enter>
Nota:
1. El nombre de una celda se puede ingresar desde la ventana de sesión. Por ejemplo si C1
debe definirse como “Descripción”, debemos digitar en la ventana de sesión: NAME C1
‘Descripcion’ o también NAME C1 ‘Descripcion’
2. El contenido de una celda particular puede ser Dataulada mediante el uso de comando
ingresados en la Ventana de Sesión. Para hacer referencia de una celda se debe indicar la
columna y entre paréntesis, el número de la fila. Por ejemplo Cx(y), hace referencia a la fila
‘y’ de la columna ‘x’ , de manera que podríamos dejar en la fila 5 de la columna 2, la suma
de la columna 3; para ello, ingresamos el comando: Let C2(5) = Sum(C3).
3. Recuerde que antes de usar la ventana de sesión para ingresar comandos, debe activarla:
hacer clic en alguna parte de ella y luego <Editor> - <Enable Command language>.
4. Cuando se ingresa algún valor en una determinada celda de una columna, todas las celdas
anteriores se rellenan con “*”.
Nota:
2. Cuando la columna contiene datos numéricos puede ocurrir que, al realizar algún cálculo, en
algunas de sus celdas se visualice “******”. En este caso se debe ampliar también el tamaño
de dicha columna.
El contenido de una celda constituye un dato. El Minitab reconoce tres tipos de datos:
- numéricos
- de tipo texto(o cadena de caracteres)
El dato numérico puede ser entero o flotante (con decimales). Cuando la cantidad es
suficientemente grande, su resultado se visualiza en formato científico de la
forma a.bcdEn.
El dato de tipo texto está formado por una cadena de caracteres válidos. El espacio en
blanco es una cadena de caracter.
Los datos de tipo fecha o tiempo (Date/Time) contienen diversos formatos de fecha o
tiempo como son mm-dd-yyyy , mm/dd/yyyy y otros, en el caso de fechas y, hh:mm:ss
en el caso del tiempo.
6. Ingreso de datos
Desde el teclado
Usando comandos
Para ello simplemente elija la columna y la fila a partir del cual desea almacenar los
datos, digite el dato y luego presione <Enter> o la tecla guía correspondiente al sentido
de ingreso de los siguientes datos, excepto flecha a la izquierda.
Al presionar <Enter>, por omisión el cursor activa la siguiente fila de la columna, hacia
abajo. De manera que , en este caso, es suficiente presionar <Enter> para continuar con
la secuencia. Si desea continuar ingresando datos en la columna de la derecha, es
suficiente presionar <CTRL.> + <Enter>
Ejemplo 01:
Ingrese los datos del siguiente cuadro en las correspondientes columnas y filas que se
muestran en el mismo.
Procedimiento:
- Digitar Productos
- Presionar <Enter>
C1 C2 C3 C4
8. Comando <FILE>
Para abrir, grabar, imprimir archivos que contienen hojas de trabajos, gráficos o
proyectos, usaremos el comando FILE.
La secuencia Es usado
<File> - <New..> Para crear una nueva Hoja o un Nuevo Proyecto
<File> - <Open Project> Para abrir un proyecto previamente grabado
<File> - <Save Project> Para grabar el proyecto activo(en uso)
<File> - <Save Project Para grabar con otro nombre al que está en uso
As…>
- Para imprimir
1. Todos los archivos(Hojas de trabajo (*.Mtw o Proyectos *.Mpj) que usaremos en el estudio
del Minitab, se encontrarán en la carpeta “Tutor Minitab”, que se encuentra en la unidad C.
2. Todos los proyectos u Hojas de trabajo que debemos grabar se deberán hacerlo en la misma
carpeta.
Ejemplo 02:
Puesto que el archivo no tiene nombre, en la siguiente ventana que salga, debemos
indicarle la carpeta y el nombre que va a tener. En el recuadro “Guardar en” ubique la
carpeta donde desea guardarlo, en el recuadro Nombre del archivo digite “Ses01” y
luego haga clic en el botón <Save>
Diferencia entre <Save Current Worksheet > y < Save Current Worksheet as>:
Si tuviéramos que grabarla con otro nombre, entonces deberemos usar la secuencia
para que pida el nombre. (Lo que también podríamos aprovechar para cambiar de
unidad, por ejemplo grabarlo en otra unidad diferente a la de uso).
Grabemos ahora todas las hojas como un proyecto llamado “Proy01”. Use la secuencia:
<File> - <Save Project as>. Como el proyecto no tiene nombre, se puede usar también
<File> - <Save Project>. A continuación ubique la unidad y carpeta donde desea
guardar y en <File name> digite Proy01. Ahora puede ver en la barra de título, el
nombre del proyecto.
Cierre el Minitab.
Se puede observar que el Minitab ha cargado a memoria las dos hojas de trabajo contenido en
el proyecto.
9. Comando <EDIT>
Para hacer algunas operaciones sobre el contenido de las hojas vamos a estudiar las opciones
principales que tiene el comando EDIT. Podemos copiar, pegar, cortar celdas.
Las principales opciones que tiene este comando son las siguientes
La figura que se muestra a continuación nos permite visualizar las opciones obtenidas
al hacer clic sobre el comando EDIT.
Ejemplo 03
Si Ud. observa, la hoja Ses01 contiene una columna de Descuentos (C4), pero la hoja ProdPc, no
tiene. Vamos a copiar la columna Descuentos de Ses01 hacia la columna 4 de ProdPc.
3. Copie toda la columna C4 usando <Edit> - <Copy Cells>. Puede usar también la
forma clásica de copiar: <CTRL>+C.
5. Pegue lo copiado en dicha columna usando <Edit> - <Paste Cells> o use <CTRL>+V.
Nota:
Por supuesto que puede usar cualquier otra forma de copiar y pegar que Ud. sepa; usando
los iconos de la barra de herramientas, por ejemplo.
Ahora vamos a copiar hacia otra hoja de trabajo nueva.
Podríamos crear la hoja nueva y luego copiar, o podríamos copiar y luego crear. La secuencia es
indiferente, lo copiado permanece en memoria hasta que no se vuelva a copiar otros datos.
7. Seleccione toda la hoja usando <Edit> - <Select all cells>. (Como podrá apreciar, los
nombres de las columnas no quedan seleccionadas y además, sólo queda seleccionada el
rango de datos, no toda la hoja) y luego copie usando <Edit> - <Copy Cells>.
9. Haga clic en la primera celda de la columna C1 y pegue lo copiado usando la opción <Paste
Cells> de <Edit>.
10. Vuelva Ses01.Mtw y copie los nombres de las columnas hacia la nueva hoja y grabe a
ésta como WSes01.
11. Grabe el proyecto para guardar las modificaciones de una de sus hojas.
Nota:
Para pasar de una hoja de trabajo a otra (en realidad de una ventana del Minitab a otra del
mismo) use las teclas: <CTRL>+<F6>.
Nota:
Observe que en la barra de titulo de la hoja de trabajo aparece el nombre de la hoja, mientras que
en la barra de titulo del proyecto(ventana principal), aparece el nombre del proyecto.
La figura anterior
muestra una lista
de algunas opciones de este comando.
Note también que las opciones están agrupadas por categoría de función: Para manejo de Hoja,
manejo de columna, para variables y celdas y para visualizar los datos.
Ejemplo 04
Vamos a extraer una parte del archivo Familia.mtw y almacenarlo en una hoja nueva
Como puede apreciar, en esta hoja tenemos, en la columna C2, la variable Sexo, en el cual los
datos son: “M” y “F”.
Vamos a crear una nueva hoja que contenga sólo a los hombres (“M”) y otra que contenga a las
mujeres (“M”).
b) Debe estar activada: <Specify wich rows to included> de la opción <Include or Exclude>. Es
decir, debemos indicarle las columnas a ser incluidas.
e) Ahora haga clic en <Ok> para volver a la ventana anterior y luego <Ok>
Ejercicio
Obtenga una nueva sub-hoja llamada “Mujeres” en la que sólo estén los de sexo femenino. Que la
nueva hoja se llame Mujeres.
Active la hoja Hombres. Extraiga a todos aquellos que provienen de las escuelas públicas (Escuela
= “Priv”). Que la nueva hoja se llame Escuela Privada
Ahora vamos a extraer los datos por Sexo y por Escuela. Para ello
- Use la secuencia :
- Copie todos los datos (incluyendo los nombres de las columnas) hacia una nueva hoja de
trabajo.
2. Use <File> - <New> - <Minitab worksheet> - <Ok> para abrir una nueva hoja de trabajo.
- En la siguiente ventana, debe rellenar los datos según como se muestra en la siguiente figura
- En el recuadro de <Stack the following columns> ingrese las columnas Varones y Mujeres
- Puesto que los subíndices pueden servir para identificar el tipo de dato en C6, almacenaremos
los subíndices en C8. Esto lo hacemos ingresando C8 en el recuadro <Store subscript in:>
-
Haga clic en <Ok>
- Haremos lo mismo con las columnas de créditos y la colocaremos en C7. En este caso deje en
blanco el recuadro <Store subscript in>, no lo necesitamos.
- Ponga por nombre Alumnos, Créditos y Sexo a las columnas C6, C7 y C8, respectivamente.
- <Data> - <Sort>
- En la ventana siguiente, en el recuadro <Sort columns(s)>, ingrese las tres columnas: Alumnos,
Créditos y Sexo.
- En el recuadro <Store sorted data in> o “Almacenar lo sorteado en”, ingrese las celdas C10 C11
C12.
Ejercicios
- Ordene sólo las columnas de los varones con sus respectivos créditos sobre las
mismas columnas.
- Ahora, apile (Stack) a todos los alumnos en la columna C6, a los créditos en C7 y
haga que la columna C8 contenga el sexo de los alumnos.
Borrar variables
Para borrar celdas con datos puede usar el comando <Edit>, donde
<Edit> - <Erase cells> permite borrar el contenido de las celdas seleccionadas y
reemplazar su contenido con “*”
<Edit> - <Delete cells> permite eliminar la celda reordenando hacia arriba las celdas
restantes.
Nota:
Si selecciona toda la columna y usa <Erase cells> borrará toda la columna,
dejándola vacía
Como se puede ver, Erase y Delete son opciones del comando Data usados para
diferentes propósitos.
Usaremos
Usaremos
<Data> - <Delete rows> para borrar una o más filas de una columna o varias,
Usted puede verificar que las columnas persisten pero sin datos
Vamos a ordenar nuestros datos por sexo y dentro de ello por nombres (campo Alumnos). En el
primer recuadro <Sort by column> o “Sortear por columna: “ ingrese la columna Sexo y en el
siguiente recuadro ingrese Alumnos. Su ventana debe quedar como indica la siguiente figura
Ejemplo 05
Abra el archivo “Emple01.Mtw”. La información contenida en ella se refiere a los empleados de
una tienda comercial del Centro de Lima. Usando todo lo que hasta aquí hemos aprendido,
resuelva cada una de los siguientes ejercicios.
0 Sin instrucción
1 Primaria completa
2 Secundaria completa
3 Estudios en Institutos
4 Estudios Universitarios
5 Bachiller
6 Titulado
7 Maestría
8 Doctorado o equivalente
9 Otras especializaciones
b) Copie los datos “Tiempo de Serv.” , columna C4, hacia la columna C9. Qué ocurre con
el nombre de esta nueva variable?
c) Obtenga una nueva hoja que contenga a todos los empleados cuyo tiempo total de
trabajo (tiempo de servicio en la tienda más experiencia previa) sea mayor o igual a 18
años.
Solución
a) Para resolver esta pregunta debemos cambiar el tipo de datos de Numérico a Texto: Para ello
use la siguiente secuencia: <Data> - <Change data type> - <Numeric to Text>
Dejamos el nombre de la nueva hoja como está y en <Condition> pondremos 'Tpo. Serv.'>=18
Ejemplo 06
La inmobiliaria “Hogar dulce Hogar” está interesada en realizar un estudio sobre el monto de
rebaja que experimenta el precio de sus inmuebles entre el momento en que el cliente consulta y
el precio final de contrato. Una primera posibilidad de estudio es extraer y separar de su base de
datos “InmbHogar.Mtw”, a todos aquellos que adquieren el inmueble al mismo precio de consulta
y los que solicitan un descuento. Use el Minitab para resolver esta inquietud.
De aquellos que compraron sin descuento, imprima en pantalla los siguientes datos: Precio de
Venta, Nro. de baños y Capacidad de la cochera
Solución:
Ejemplo 07
Para ello debemos hacer uso de la opción <Code> del comando <Data>. La siguiente ventana
muestra los datos que se debe ingresar para obtener lo pedido.
En <Code data from column> ingresamos la columna C6 ó “Sótano”.
Nota:
Mucho de estos cálculos se pueden realizar también mediante el lenguaje de comandos
ingresados en la Ventana de Sesión, al estar activado el modo de ingreso de comandos.
Recuerde que para activar este modo debe hacer clic primero en la Ventana de Sesión y
luego usar <Editor> - <Enable Command Language>.
<Calculator> Permite realizar una serie de operaciones aritméticas sobre los datos de la
hoja. Estos cálculos pueden incluir el uso de una o más funciones
aritméticas, trigonométricas, estadísticas, de fecha/hora, estaídistica por
fila, así como ordenar columnas.
<Column Statistics..>Esta es la primera opción del Minitab que permite obtener un conjunto de
resultados estadísticos sobre una determinada columna. Se puede obtener
el total, la media, la desviación estándar, rango, el valor máximo, valor
mínimo, la mediana, la suma de los cuadrados, etc. En cada operación sólo
se puede calcular un estadístico.
<Row Statistic...> Como en el caso anterior, permite obtener estadísticos por fila. Un
estadístico de los mencionados en la opción anterior, por columna.
En la figura anterior podemos observar que se puede generar conjunto simple de números
<Simple Set of Numbers...>, tales como 0, 1, 2, 3, ... ó 7, 13, 19, 25, ...
Si desea ingresar una columna de datos literales, como nombre de meses, productos,
personas, etc. use <Text Values>.
<Set Base> Permite ingresar una semilla para la generación de una nueva secuencia de
números aleatorios.
<Random Data> Permite generar diversos tipos de datos aleatorios: Binomiales, de tipo
Poisson, Normales, Beta, etc.
La siguiente figura muestra las diferentes opciones que tiene estas dos opciones.
<Matrices> Permite leer, realizar operaciones con matrices
Con el <Calculator> podemos realizar diversos tipos de operaciones aritméticas con las
columnas de la hoja y dejar el resultado en una nueva columna o en la misma; se puede
almacenar el resultado en una variable, cuyo valor se guarda en una nueva columna
disponible.
En las expresiones aritméticas que use se pueden incluir diversos tipos de funciones
soportadas por el Minitab.
Ejemplo 08
Supongamos que una columna contiene los valores de una variable aleatoria X, almacenada en la
columna C1. La columna C2 contiene los valores de las probabilidades para X = x; como se puede
visualizar en el archivo LDistrib01.Mtw. Queremos calcular la varianza de X, sabiendo que V(X) =
E(X²) – [E(X)]².
Vamos a calcular la varianza de una manera detallada, usando columnas de trabajo. Para ello
debemos calcular en C3 el producto de X*P(X = x), para luego calcular la suma con SUM(C3), que
será igual a E[X]. Del mismo modo calculemos en C4 el producto X*X*P(X = x), para luego calcular
SUM(C4), que representará E[X²]. Finalmente obtendremos V[X] = E[X²] – (E[X])² y el resultado lo
guardaremos en una variable cualquiera como R.
Paso 02: Calcularemos el producto de X por P(X = X). Usemos la siguiente secuencia
<Calc> - <Calculator>.
<Ok>
Paso 03: Ahora calcularemos X² por P(X = x). Usemos la siguiente secuencia:
<Calc> - <Calculator>
<Ok>
<Calc> - <Calculator>
<Ok>
Verá que el resultado está en R que es el nombre que el Minitab le asigna a la primera celda de la
primera columna disponible y que se encuentra a la derecha de los datos.
Observación:
Si en lugar de R hubiéramos usado K1, el valor sería almacenado en esta variable y no en una
celda de Minitab. Es más conveniente esta modalidad ya que si más tarde usa dicha columna, el
valor de R se perderá.
Nota:
1. Otra forma de calcular la varianza directamente, sin usar columnas de trabajo del la hoja
es:
Ejemplo 09
1. Usando el ya clásico “COPY – PASTE”, ingrese en las columnas C1 y C2, los siguientes datos que
se encuentran en el archivo Lista de faltas.doc
Pamela 12
Carlos 16
Miguel 10
Sandra 7
Felipe 2
Alonso 12
Karla 25
Yacole 18
Baslavi 9
Isabel 12
Lorena 4
Mariella 13
Eduardo 8
Mario 16
Rodrigo 7
Sandra 24
Victor 18
Enrique 14
James 6
Alvaro 17
Solución
Nota:
1. Por supuesto que también puede ingresarlos directamente
2. La primera columna también puede ingresar usando la secuencia
<Calc> - <Make Patterned Data> - <Text Values…> y en el recuadro “Text Values” digitar los
nombres separados por un espacio en blanco, aunque su tamaño es limitado y su uso se remite
sólo a datos de texto que no tienen espacios en blanco.
- Usamos la calculadora:
<Calc> - <Calculator>)
- <Ok>
Vamos a crear una hoja de trabajo que contenga el ingreso mensual, en miles de dólares, que una
compañía exportadora obtuvo durante los años 1991 a 2002. La columna C1 contendrá los meses,
las columnas C2 hasta C13 los años.
- <Ok>
Hasta aquí hemos querido presentar las diversas opciones de los comandos de la barra de Menú.
Para fijar ideas hemos desarrollado algunos ejemplos propios de cada comando y sus respectivas
opciones. Completaremos ahora el estudio de los comandos del Minitab sólo mencionándolos con
un breve comentario para luego realizar aplicaciones que requieran el uso de cualquiera de sus
opciones.
<Power and Simple size> Permite realizar cálculos sobre la potencia y tamaño de muestra para
ejecutar análisis prospectivos y retrospectivos.
En los próximos capítulos tendremos muchas oportunidades para practicar el uso de cada una de
las opciones del comando STAT.
<Contour Plot...> Plotea gráfico de contorno al estilo de curvas de nivel, como gráficos
bidimensionales definido por tres variables X, Y, Z.
<DotPlot> Visualiza puntos por cada observación a lo largo del Eje X. Si hubieran más
de una ocurrencia, sobrepone los puntos.
<Pie Chart...> Permite construir gráficos de tipo torta con una serie de opciones disponibles.
Usaremos
Si se hace click en la Ventana de Sesión y luego se activa este comando se puede usar
<Editor> - <Enable Commands> Si desea usar la ventana de sesión para ingresar comandos
en modo Batch. Para ello, primero debe hacer clic en la ventana respectiva.
En los próximos capítulos haremos una descripción más detallada de los comandos <Calc> , <Stat>
y <Graph>
5. Codificación de variables
7. Diagrama de cajas
8. Introducción a Regresión
Como hemos visto antes, esta opción se encuentra dentro de las opciones de <Table>, en el
comando <Stat> y nos permite la obtener estadísticas sobre la
- frecuencia absoluta
- frecuencias relativas
Ejemplo 1
Con la finalidad de detectar algún comportamiento respecto a los resultados del año anterior, se
decidió realizar un estudio estadístico descriptivo de estos datos.
A continuación trataremos de plantear una serie de preguntas y las resolveremos usando las
diversas herramientas que nos ofrece el Minitab.
1. Cómo obtener una distribución de frecuencias por edad? Cuántos alumnos son de sexo
masculino?. Cuál es el porcentaje de estudiantes mujeres?. Podríamos obtener el total de
alumnos que eligieron una determinada facultad?
Solución
La solución a este ejercicio lo haremos usando la opción <Tally> que está dentro de <Tables>,
del comando <Stat> el cual permitirá dar respuesta a las preguntas.
En efecto:
Variables: Sexo
Display: Counts
<Ok>
Podemos pedir que nos muestre porcentajes (frecuencia relativa) o total acumulado.
En este caso sólo cambiamos Display, donde activamos Percents. La secuencia es la siguiente:
<Ok>
<Stat>-<Tables> - <Tally>
En muchas ocasiones el cálculo que debemos realizar requiere que los datos estén ordenados.
En la ventana de la derecha se
muestra los recuadros que debemos
llenar para que Minitab pueda
ordenar nuestros datos.
En los cuadros de <By column:> debemos ingresar la columna que determina el criterio de
ordenamiento. El nivel de ordenamiento se define de acuerdo a esta lista. Se puede ordenar hasta
por cuatro columnas.
En <Store sorted columns> debemos ingresar las columnas donde debemos guardar los resultados
ordenados.
Ejemplo 2
Prosigamos con los datos del ejemplo anterior. Si el orden de importancia de las facultades
históricamente está determinado por el porcentaje de postulantes a cada una de ellas, cuántos
alumnos y en qué porcentaje eligieron las primeras dos facultades de mayor importancia?
Suponga que el orden de importancia viene dado por la siguiente secuencia: Medicina, Biotecnia,
Biología y Agricultura.
Solución
Si Ud. Observa los datos verá que no se encuentran ordenados por facultades. Esto implica que
debemos hacer uso de la opción SORT.
Paso 01.
Puesto que al ordenar los datos sobre la misma hoja, se va a modificar la disposición original, o en
el peor de los casos, podemos perder algunos datos, por seguridad vamos a abrir una nueva hoja
de trabajo. Para ello usemos la siguiente secuencia:
*** Recuerde que debe copiar todos los datos hacia esta nueva hoja ***
Paso 02:
Debemos ordenar los datos por Facultad. Para ello usamos la siguiente secuencia:
<Manip> - <Sort>
<Sort column(s)> ingresamos todas las columnas. Para ello podemos seleccionar todas y luego
hacer clic en botón <Select>, como se muestra en la siguiente figura:
Después de seleccionar, debe aparecer Edad – Movilidad en el recuadro Sort column(s).
Como debemos ordenar por facultad, en <Store sorted column(s) in:> ingresamos C1–C10
Ahora debemos decirle al Minitab que queremos que ordene por Facultad, para ello en la primera
línea de <Sort by column:> ingresamos Facultad.
*** Observe que puede ordenar por varias columnas a la vez ***
*** Podríamos ordenar por Sexo, por Facultad, por Colegio y por edad ***
Paso 03:
Ahora debemos obtener frecuencias absolutas y porcentuales. Para ello usamos <Tally>. La
secuencia es la siguiente:
<Stat> - <Tables> - <Tally>
A continuación pasamos a estudiar algunos tipos de gráficos que pueden ser usados en la
Estadística Descriptiva.
Gráfico de Histograma
Puesto que un histograma de frecuencias necesita el rango, número de clases, amplitud, etc.
primero obtendremos estos resultados.
Total
De acuerdo a los resultados anteriores, el límite inferior del primer intervalo es 34.16; el límite
superior del último intervalo es 74.24; el rango es 38.08 y el total de datos es n = 50.
<Graph> - <Histogram>
En el gráfico podemos apreciar que en efecto hay 8 intervalos pero se muestra los puntos medios y
no los límites inferior y superior de cada intervalo. Más adelante veremos que, cuando se maneja
datos agrupados y se desea construir una tabla de frecuencias, se puede hacer a partir del
histograma obtenido.
Usaremos la opción ScatterPlot cada vez que se desee obtener un gráfico que relacione una variable
contra otra. Por ejemplo, en los datos que estamos usando, nos interesaría saber cómo se comporta
el total de créditos en relación a la edad de los alumnos.
Ejemplo 3
¿Podríamos obtener algún tipo de gráfico que nos permita visualizar la relación que hay entre la
variable Edad y la variable Créditos del archivo Ingre99.mtw?
Solución
Comenzamos abriendo el archivo Ingre99.mtw. Graficar una relación entre dos variables significa
realizar un cruce entre ellas. Para ello haremos uso de la gráfica de tipo PLOT.
Plotearemos las variables Edad y Créditos de los alumnos de la base de datos Ingre99.mtw. La
secuencia <Graph> - <ScatterPlot> nos genera la ventana de la izquierda. Seleccionamos <Simple>
y hacemos clic en <Ok> para pasar a la siguiente ventana.
Ubicaremos la variable Edad en el Eje X y Créditos en el eje Y. Para ello es suficiente hacer
doble clic en Créditos primero y en Edad después.
Project
Connect
Lowess
Project
Symbol
La opción Project lines muestra la gráfica de las variables en forma de líneas verticales, lo que nos
permite comparar el número de créditos de los alumnos de acuerdo a la edad.
Recomendamos que pruebe con las otras opciones y vea cuál se adapta a sus exigencias.
En el gráfico observe que hay una cantidad de créditos correspondiente al valor de las edades. Más
créditos llevan los alumnos entre las edades 18 y20.
Nota:
Podríamos decir que este tipo de gráfico nos permite observar la densidad de los datos por cada
cambio en la variable ubicada en el Eje X.
Esta es también una de las formas clásicas de representar gráficamente una distribución de
frecuencias
El Minitab ofrece una diversidad de gráficos de tipo Chart que pueden ser usados para visualizar
nuestros datos.
Sin embargo en este caso, el tipo de gráfico Chart se fundamenta en aquello que se quiere graficar:
Puede graficarse como variable a la frecuencia de los datos
Puede graficarse como variable a la suma de los datos, la media, mediana, desviación estándar,
etc.
Ejemplo 4
Obtener una gráfica de tipo Chart para las mismas variables del ejemplo anterior. Primero
graficaremos sólo la variable Edad.
Solución
Al usar la secuencia <Graph> - <Bar Chart> obtenemos la siguiente ventana del lado izquierdo.
Luego de hacer clic en <Ok pasamos a la ventana que se muestra, donde completamos los datos
según se muestra en la derecha.
Qué ocurre si vuelve a graficar pero ahora hace clic en <Data View> y elige Project Line?
Podríamos decir que la mayor parte de los alumnos tienen entre 18 y 19 años.
Vuelva a usar la secuencia <Graph> - <Bar Chart>. De las opciones de <Bars represent> seleccione
<A function of a variable>. Haga clic en <Cluster> (segundo cuadro). Con ello logra obtener una
ventana como la que se muestra. Complete según se indica para graficar el crédito por edad.
Qué ocurre si en
lugar de usar la
opción Mean de
<Function>
selecciona
Count>?
Y si ahora
selecciona Sum o
alguna otra
función?
Por lo general, se
construye gráficos
de una variable en relación a otra. La variable determinante, es Y, y la variable X hace referencia a
la categoría de la distribución y en una relación lineal, constituye la variable independiente.
Ejercicio
Use la secuencia: <Graph> - <Bar Chart …> - <Cluster> - <Ok>. Como variables categóricas elija
Sexo y Edad. Haga clic en <Multiple graphs>. En <By variables with groups in separate panels>
ingrese Facultad. Luego <Ok> y <Ok>. Puede analizar los gráficos resultants?
Ejemplo 5:
1. Compare gráficamente la distribución de las horas dedicadas al estudio y a ver TV, en ventanas
diferentes.
2. Construya una gráfica que de las horas de estudio y horas de TV respecto a la edad.
Solución
<Graph> - <Bar Chart> - <Ok> En variables categóricas ingrese Hrs Est y Hrs TV. Luego haga
clic en <Ok>.
En <Multiple Graphs…> seleccione <In separate panels of a same graph>. Luego <Ok>
Observe también que, usando el tipo de gráfico <Chart> podemos visualizar en una sola ventana
dos o más gráficos. En la tercera figura hemos superpuesto las Horas de TV (en color negro
sólido) a las Horas de estudio.
Si quisiéramos trabajar con un cuadro para la distribución de datos agrupados, y a partir de ella,
generar todos los estadísticos descriptivos que nos pueda proporcionar, el Minitab dispone de su
Lenguaje de Comandos que se ingresan en la Ventana de Sesión. Por ello a esta ventana se le
conoce también como la ventana de comandos.
De manera que el Minitab ofrece a sus usuarios dos modos de operación o de interfase:
Nota:
Por la dificultad que tiene el uso de la ventana Sesión o de Comandos y por el natural apego de todo
usuario de la computación al manejo de ventanas, esta sección la desarrollaremos en una página
avanzada .
Una gráfica de puntos permite representar a cada uno de los datos mediante un punto en el Eje X.
Si una determinada observación se repitiera, los puntos se visualizarán uno sobre otro; igualmente,
si hubiera observaciones muy próximas, los puntos se sobrepondrían uno sobre otro.
Ejemplo 6
Abra el archivo “Ingre99.Mtb” . Grafiquemos primero la variable Edad. Esto lo hacemos mediante:
Se puede observar que un gran porcentaje de alumnos acumulan créditos que van desde 80 hasta
130. Y que, por otro lado, el conjunto de datos observados presenta dos grupos fuera de lo normal,
fuera de contexto, son los “outliers”. Si se eliminan estos datos incluyendo los que están alrededor
de 70, podríamos decir que los créditos acumulados se encuentran normalmente distribuidos.
Ejercicio
Compare gráficamente las horas dedicadas al estudio vs horas dedicadas a ver la televisión. Qué
conclusiones puede extraer. Quiénes tienden a ver más televisión?
Ejercicio
Minitab ofrece codificar datos numéricos a numéricos, datos numéricos a texto, de texto a numéricos,
de texto a texto. Esto por que para efectos de graficar puede ser que para un tipo de gráfico
determinado, no permita hacerlo con variables de tipo texto o literales.
No siempre los datos son numéricos. Por ejemplo en el archivo Ingre99.mtw tenemos tres
variables que son de tipo carácter: Sexo, Colegio y Facultad.
Si bien el Minitab dispone de la opción <Tally> para obtener estadísticas en cuanto a frecuencia
absoluta y relativa de estas variables, sin embargo no se puede obtener un gráfico de ellas, excepto
de tipo <Chart>.
Pero si bien no podemos disponer de todos los tipos de gráficos, sí podemos codificar estos datos
como variables numéricas, como lo veremos en los siguientes ejemplos.
Ejemplo 7
Obtener una distribución gráfica de puntos (DotPlot) para las variables Facultad por Sexo.
Solución
Si Ud. intenta hacerlo, al usar <Graph> - <DotPlot> obtendrá una lista de variables en las que no
se encuentra ninguna de las de tipo literal. En este caso facultad no aparece.
Si pudiéramos construir otra columna que contenga un 1 por cada alumno de Agraria, un 2 por
cada alumno de Biología, 3 por cada alumno de Biotecnia y 4 por los alumnos de Medicina,
podríamos disponer de esta nueva columna, de tal forma que al usar <Graph> -
<DotPlot> ingresamos Créditos en <Variables> y en <By variables>, ingresamos la nueva
columna.
Para construir la nueva columna numérica, a partir de la columna Facultad, de tipo texto, use
En <New> ingresamos 1.
<Graph> - <DotPlot>
En Y ingresamos Créditos
Vamos a construir gráficos circulares tipo torta. Para ello usaremos el archivo Ingre99.
Ejemplo 8
Solución
Para verificar si los porcentajes son los indicados podemos usar <Tally>.
Para ello usamos la secuencia: <Stat> - <Tables> - <Tally> - <Variables> C11 . Active todas las
opciones. Compare estos porcentajes con los del gráfico.
Ejemplo 9
A continuación haremos uso del Minitab para obtener las medidas de tendencia central, de
dispersión y las de posición que forman parte de la estadística descriptiva.
La varianza
La desviación estándar
Cuartiles.
Dividen a los datos en cuatro grupos porcentualmente del mismo tamaño. El primer cuartil, Q 1,
indica que el 25% de los datos tienen valores como máximo a Q 1. El segundo cuartil, Q2
representa el 50% de los datos inferiores o iguales a él. Y Q 3 representa a los 75% de valores
menores o guales a dicho valor.
Deciles: Equivalente a los cuartiles, pero que divide a los datos en 10 grupos iguales.
Usemos el minitab
Además de las estadísticas por fila y columna que nos proporciona el comando <Calc>,
disponemos del comando <Stat> que en su primera opción tiene a <Basic Statistics> para
proporcionarnos las estadísticas antes mencionadas, visualizándolas en la ventana de sesión, o
almacenando en la hoja de trabajo activa.
Con solo apreciar la figura anterior, podemos deducir que el Minitab constituye una buena
herramienta de apoyo tanto en el estudio de la Estadística como en el campo de la investigación.
<Store Descriptive Statistics...>: Los que permiten guardar los resultados en columnas
Las opciones
<1- Sample Z ...> , <1 – Sample t >, <2 – Sample t> y <Paired t …> :
nos permiten realizar procesos de estimación y prueba de hipótesis para una o dos poblaciones, o
realizar análisis de datos pareados.
Las opciones
nos proporcionan estimaciones a partir de las proporciones muestrales, sobre una o dos
poblaciones.
Las opciones
<Normality test>: Que permite realizar una prueba de hipótesis para examinar si los datos se
ajustan a una distribución normal, proporcionando además una gráfica de tipo Plot.
A continuación resolveremos algunos ejemplos usando estas herramientas y las otras serán
tomadas en cuenta dentro del tema que les corresponde
Ejemplo 10
Solución
Usemos la secuencia:
Donde
Interpretación:
Los 120 alumnos tienen como Promedio General de grupo a 11.071; con una desviación estándar
de 0.486; centrados en 11.070, que es la Mediana
Izquierdo: Q1 - 3 RIQ
Derecho : Q3 + 3 RIQ
En los resultados podemos apreciar que Q1 = 10.74; esto significa que el 25% de los alumnos
tienen un promedio máximo de 10.74. Como la mediana es 11.07, entonces el 50% de los
promedios no sobrepasan 11.07.
Del mismo modo, Q3 = 11.55 indica que el 75% de los promedios de los alumnos están por debajo
de 11.55; dicho de otra manera, el 25% de los alumnos tienen un promedio superior a 11.55.
Nota:
Si un dato observado se aparta más allá de las fronteras exteriores, se dice que el dato es un
“outlier” extremo y se representa por “0”; en caso contrario se dice que presenta un “outlier”
moderado, en cuyo caso se representa por “*”.
Ejemplo 11
Ahora obtendremos estadísticas del promedio general por a) sexo y b) por Colegio de
procedencia. Además pediremos que nos muestre el histograma de los datos así como un
resumen gráfico (Graphical summary).
Solución
Usando la secuencia:
<Stat> - <Basic statisic> - <Display descriptive statistics ...>
a) Por sexo
Total
En cuanto a la gráfica pedida, en la siguiente figura solo mostramos las ventanas de gráfico
correspondiente a la variable Sexo = “M”. La ventana de la izquierda contiene el histograma. El
promedio de los varones tienen mayor variación (CV(X) = 16.424).
En ella se puede apreciar que el promedio general de los varones está alrededor de 12. Presenta
un sesgo hacia la izquierda; es decir, es asimétrica hacia la izquierda. En cuanto a la segunda
ventana podemos encontramos una descripción gráfica así como una cuantitativa del promedio
general de los varones. Hay estadísticos como Skewness, Kurtosis, intervalos de confianza, P
value, que nos los analizaremos por ahora.
En la siguiente sección comentaremos gráficos de caja, que se muestra horizontal y en azul, por
debajo del histograma.
Total
La siguiente figura describe los elementos que conforman una caja en un gráfico BoxPlot. La
forma de visualizar la caja depende de cómo se pide la gráfica.
Le media podada resulta del cálculo de la media aritmética, luego de eliminar estos outliers.
Si la mediana se encuentra muy cerca de la cara lateral derecha (superior en este caso) es por
que se acerca al tercer cuartil Q3, en cuyo caso se dice que los datos presentan una asimetría
hacia la izquierda.
Ejemplo 12
Solución:
Haciendo uso de las fórmulas para las fronteras dadas anteriormente, encontramos:
Ejemplo 13
Solución
Ante todo usaremos el comando <Stat> - <Basic statistics> - <Ddisplay descriptive ...>
Como se puede apreciar, los créditos de las alumnas presentan una cierta inclinación hacia el
tercer cuartil; es decir, un gran porcentaje de alumnos tienen promedio por encima de la mediana
También podemos obtener gráficos de caja usando el modo texto del Minitab. Para ello usamos la
secuencia de comandos:
-----------
OO ------------I + I----
-----------
+---------+---------+---------+---------+---------+------Créditos
0 25 50 75 100 125
Nota:
- Observe los dos “outliers” que ya habíamos observado antes. Y son extremos.
- Observe ahora una gráfica BoxPlot para la variable Prom. Gral por el tipo de
Movilidad.
La gráfica siguiente nos indica que no tienen “outliers” y la asimetría es muy leve en el caso de los
que no tienen movilidad.
A continuación mostramos también los resultados obtenidos al usar esta opción de Graph, pero en
la modalidad de caracteres <Character graph>.
Movilidad
--------------------------
0 -------------I + I--------
--------------------------
---------------
1 ----------------I + I--------------
---------------
--------+---------+---------+---------+---------+--------Prom.Gral
9. Graficos agrupados
Ejemplo 17
Construya una gráfica de barras agrupadas para comparar el total de alumnos por facultad,
provenientes de los colegios públicos y privados.
Seleccione la opción <Cluster> y luego clic en <Ok>. En <Variables categóricas> introduzca las
variables Colegio y Facultad.
Hagamos que las barras se muestren de colores diferentes: Para ello, use botón derecho sobre
una de las barras. Clic en <Edit bars>. Haga clic en Custom de <Fill pattern> y seleccione el color
Lima en <background color>. En la ficha Groups, ingrese la variable Colegio en el recuadro.
Luego haga clic en <Ok>. Obtendrá el siguiente gráfico.
Ahora use la opción <Stack> e ingrese las dos variables. Obtendrá el gráfico de la derecha.
Pedimos a Ud. que obtenga la segunda gráfica que representa una gráfica de barras agrupadas
de tipo <Stack>, una sobre otra. Tomando en cuenta para ello la variable Sexo.
En Minitab podemos trazar la gráfica de varias variables en la misma ventana de gráficos. Esto
permite un análisis del comportamiento de las mismas a través del tiempo. Podemos ubicar en el
Eje X la variable que permite la generación de los eventos en las otras variables y visualizar su
recorrido por cada cambio de X.
Ejemplo 28
Abra el archivo DemProd.Mtw que se encuentra en la carpeta de trabajo. Este archivo contiene la
demanda de tres tipos de productos: A, B y C de la empresa “Producciones Magic S.A.” durante
los meses del año 2001.
Una vez abierto el archivo Ud. verá que la primera columna contiene los meses del año 2001.
Usaremos esta columna para graficar las otras tres columnas.
La secuencia es:
Como puede apreciar, hemos ingresado la columna de los meses en el Eje X y la demanda de los
tres productos, en el Eje Y.
Observe que la variable Mes se ha repetido para las tres variables de producto.
En <Multiple graph> seleccione <Overlaid on the same graph>. Luego <Ok> y <Ok>.
11. Introducción a Regresión
Hagamos una introducción a las ecuaciones de regresión, que más tarde las trataremos dentro del
concepto de Intervalos Confianza y Pruebas de Hipótesis.
Abra el archivo Regre01.Mtw que se encuentra en su carpeta de trabajo. Este archivo contiene la
información del Producto Bruto Interno (PBI), el Gasto Público (GP) y las Exportaciones (EX) de un
determinado país entre los años 1984 – 1996. Respecto a estos datos queremos encontrar la
relación entre el PBI y el GP.
YPBI = + GPT + T
Coeficiente de correlación :
Ejemplo 29
Ante todo plotearemos las variables PBI y GP para ver si efectivamente existe una relación
lineal PBI = f(GP) entre ellas. Esto lo haremos usando la siguiente secuencia:
La gráfica nos indica que efectivamente existe una relación entre las variables. Pero qué tan bien
queda explicada, PBI por GP; si se incrementa una unidad de GP, en cuánto se incrementa el
PBI? Qué grado de correlación existe entre ellas?
Necesitamos pues obtener mayor información. Esto nos lo permite el uso de la regresión lineal.
Usando los datos del archivo Regre01.Mtw, obtendremos los estimadores de la ecuación YPBI =
+ GPT + T
Igualmente podemos almacenar una serie de resultados como los valores de los coeficientes, la
tabla de los residuales, etc.
Los resultados se dan a continuación; también mostramos la gráfica de los residuales vs el PBI
ajustados.
Regression Analysis
Analysis of Variance
Source DF SS MS F P
Total 12 4102560
También podemos graficar la recta de ajuste sobre el diagrama de dispersión, usando <Stat> -
<Regression> - <Fitted Line Plot>.
Con estos resultados, y suponiendo que los ajustes y residuales se encuentran en la columna
C6(fitts1) y C7(resid1), hacemos uso de la siguiente secuencia:
EJ02. La siguiente tabla muestra el porcentaje de familias con diversos niveles de ahorros durante
los años 1969 y 1994
b) Construir un gráfico de torta para ver la distribución de las personas por nivel de ingreso en
los dos años.
EJ03. Los siguientes datos representan los tiempos de sobrevivencia(en dias) de 50 pacientes
aquejados de cáncer: 42 45 51 46 340 81 243 63 155 151 37 138 245
377 537 455 776 163 20 1234 201 2970 456 1235 1581 40 3808 1804 719 365 129 45
9 234 1092 827 272 188 54 93 128 822 282 532 102 152 182
2827 2672 28 53 912.
EJ04. La siguiente tabla muestra la distribución de frecuencia de los tiempos (en minutos) que
tiene que perder un conductor para desplazarse desde El Jockey Plaza Shopping Center hasta La
Avenida Arequipa.
Intervalo de clases Frec. Abs. Frec. Rel. Frec. Abs. Ac. Frec. Rel. Ac.
10.0 - 14.9 3
15.0 - 18.9 10
19.0 - 22.9 14
23.0 - 26.9 25
27.0 - 30.9 17
31.0 - 34.9 9
35.0 - 38.9 2
a) Obtenga la amplitud de clase
d) Complete la tabla
Observación
EJ05. Construya una tabla de distribución de frecuencias a partir del gráfico de histograma y
determinando el número de intervalos mediante el criterio de Sturges (k = 1 + 3.323Log(n) ).
Solución
Procedimiento:
P2. Obtenr las estadísticas: Máximo, Mínimo, Rango, N total usando: <Stat> - <Basic Statistics> -
<Display descriptives statistics>. Ingresar la variables Saldo (C1) - <Statistics> - Activar Mean,
Maximum, Minimum, Range y N total - <Ok> - <Ok>
Paso 4: En el gráfico, botón derecho sobre el eje de categorías (Eje X). Hacer clic en <Edit X
scale>. En la ficha <Binning>, activar: <CutPoint> y <Midpoint cutpoint positions>. Al interior del
recuadro digitar: Min:Max/Amplitud. En nuestro caso: 32:3578/295.5. - <Ok>.
Nota:
Esto permite reconstruir el histograma con el número de intervalos requerido. Si C tuviera muchos
decimales, trate de redondear por exceso a fin de que logre obtener los intervalos deseados.
Cuando esto ocurra se tendrá expresado el Mínimo y Máximo así como cada uno de los extremos
de los 12 intervalos. Si ocurre como en este ejemplo, el extremo del intervalo que falta es
suficiente sumar C al extremo inferior.
Paso 5: Colocar la frecuencia absoluta como etiqueta de cada barra: Este es el único y principal
motivo por el que se recurre al gráfico. Haga clic con el botón derecho sobre cualquiera de las
barras del gráfico; seleccione <Add> y luego <Data labels>. Luego <Ok> sin modificar nada en la
ventana. Copie en su tabla en la columna fi.
Paso 6. Obtener la frecuencia absoluta acumulada: Fi. Haga clic con el botón derecho sobre el eje
vertical; hacemos clic en <Edit Y scale>. En la ficha <Type>, activar la casilla Acumulative values
cross bins; <Ok>.
Paso 7. Obtener la frecuencia relativa: Botón derecho sobre el Eje vertical; en Type seleccionar
<Percent> - <Ok>. Desactivar <Acumulative …>
Paso 8: Obtener la frecuencia relativa acumulada. Repetir el paso 7 pero ahora activar
<Acumulative ….> - <Ok>.
Paso 9. Obtener la marca de clase o punto medio: El punto medio es la semisuma de los límites
inferior y superior de cada intervalo.
Como se puede observar, la función que realizan estas opciones son similares a las que
se encuentran en las ventanas del comando <Edit> o <Edición> de muchas aplicaciones,
sólo que en el caso del Minitab, todas ellas se aplican sobre un conjunto de celdas(filas
o columnas seleccionadas) de la hoja de trabajo.
Nota:
Dejamos para un desarrollo posterior la opción <Link> que permite realizar enlaces
entre una y otra columna bajo la concepción DDE(Dynamic Data Exchange)