Sei sulla pagina 1di 86

1.

Comandos de uso frecuente (1)


Puesto que el objetivo de este trabajo es el desarrollo simplificado de los principales
temas de la Estadística y la descripción y uso del programa Minitab, en este capítulo nos
dedicaremos a la descripción básica de las principales características del programa
Minitab. Primero haremos una presentación del entorno en el cual opera el programa: a
nivel de datos, de los resultados y la presentación de gráficos. Luego nos dedicaremos a
presentar las características funcionales de cada uno de los comandos de la Barra de
Menú, así como una muy breve explicación de las opciones más comunes de cada
comando. Naturalmente que, para su mejor comprensión haremos uso de algunos
ejemplos sencillos de aplicación directa.

Los temas que trataremos en este capítulo serán los siguientes:

1. Introducción
2. Anatomía de la ventana principal
3. Dar nombre a una columna
4. Amplitud de una columna
5. Contenido de una celda
6. Ingreso de datos
7. Breve descripción de los comandos de la Barra de Menú
8. Comando File
9. Comando Edit
10. Comando Data
11. Comando Calc
12. Comando Stat
13. Comando Graph
14. Comando Editor>

1.Introducción

El Programa MINITAB es un programa estadístico muy potente, versátil y de fácil uso,


que proporciona un amplio rango de aplicaciones estadísticas, capacidad de gráfico, una
interfase amigable con el usuario y una extensa ayuda en línea con un menú contextual
muy sensitivo.

El programa Minitab ha tenido muchas versiones en su evolución. La versión actual es


la 15.0. Puesto que esta versión aún tiene menos de un año de haberse puesto en
comercialización, en algunos casos haremos referencia a la versión 14, por cuanto es esa
la que se encuentra en nuestro medio. Este programa ha tenido un amplio uso desde los
años 60, abarcando tanto a mainframes como a minicomputadoras, y desde los años 80
en las PC’s. Se han escrito versiones para diversos equipos entre ellos, para IBM y
todos los compatibles; para Macintosh; etc.
Las versiones 14 y 15 ofrecen, entre otras facilidades:

Capacidad estadística comprensiva y completa, que incluye análisis de datos


exploratorios, cálculos básicos, regresión, análisis de varianza, tamaño de muestra,
análisis multivariante, distribuciones no-paramétrica, series de tiempo, tabulación
cruzada y simulación. La versión 15 presenta un análisis multivariante mucho más
completo.

Calidad de gráficos de alta resolución, en particular la versión 15, con una


representación de calidad, totalmente editables y que incluye capacidad de afinamiento
para la identificación de puntos en el ploteo de los datos, pegar los gráficos en otras
aplicaciones; todo ello dentro de una diversidad de tipos y opciones en el manejo de los
mismos.

Seguridad y mejoramiento de otras características que incluyen

1. Diagrama de cajas, de Pareto, diagramas de causa-efecto


2. Diagramas para el control de procesos estadísticos
3. Diagramas y gráficos históricos
4. Capacidad de análisis y exploración de datos
5. Diseño de experimentos con capacidad de análisis completos o fraccionados

Una capacidad de manejo de datos muy potente que permite importar datos hacia un
proyecto, desde versiones anteriores, hojas de cálculo, bases de datos y archivos de
texto; enlace de datos hacia otras aplicaciones

Muchas facilidades que hubiéramos querido apreciar en la versión 14, se tienen en la


versión 15, como el caso de disponer de dos formas de captura de datos para realizar
estimaciones por intervalos o pruebas de hipótesis así como su especial característica: la
parte gráfica.

Facilidades para el manejo de Macros, lo que permite escribir programas en Minitab,


extendiendo su funcionalidad, los que son procesados por un equipo en la modalidad de
procesamiento en batch.

No está demás resaltar el uso del Minitab en los problemas de Causa – Efecto y
también en la diversidad de aplicaciones que puede proporcionar en el Control de
Calidad.

El Minitab y los proyectos

En los últimos tiempos (diremos desde el inicio de los 90) la ciencia de la computación
en lo que a sistemas personales se refiere, se ha orientado a la programación orientada a
objetos y como consecuencia de ello aparecieron los lenguajes visuales; los que han
permitido el diseño y la construcción de programas muy grandes y complejos que
operan dentro de un escenario. Esto dio origen a los llamados espacios de
trabajo(escenario) los que se configuran dentro de lo que se conoce como proyectos.

Las últimas versiones del Minitab permite la construcción de proyectos para resolver
los problemas de proceso de datos. Un proyecto está formado por un conjunto de Hojas
de trabajo, de resultados almacenados en variables temporales, de gráficos a partir de
los datos almacenados en las hojas, de los enlaces entre una hoja u otras aplicaciones
externas y de la secuencia y ejecución de macros. En particular un proyecto está
formado por una o más Hojas de Trabajo.

Extensiones de proyectos, hojas y gráficos

Como es lógico, tanto los proyectos como las hojas de trabajo y los gráficos cuando de
almacenarlos se trata, deben tener un nombre y una extensión.

Los proyectos, hojas de trabajo y los gráficos se graban con el nombre que nosotros
deseamos. Estos nombres se distinguen por su extensión. En el caso de los proyectos la
extensión es MPJ. La extensión en el nombre de los archivos que son hojas de trabajo
es MTW, y en el caso de un gráfico es MGF.

Nota:

1. En el caso de las hojas de trabajo, la versión 14 del Minitab permite grabarlas en


formato del Excel 97 o en otras versiones anteriores del Minitab.
2. En el caso de los gráficos podemos grabarlo con extensión MGF para ser
recuperados en el Minitab. Podemos grabarlos en formato JPG para se
visualizado como imagen u objeto en otras aplicaciones, pero ya no por el
Minitab.
3. Como en el caso anterior, se puede grabar un gráfico con extensión TIF, pero no
podrá ser recuperado al Minitab.

Una vez instalado el programa Minitab, su Sistema Operativo colocará un icono


de acceso directo en el escritorio, como el que se muestra además de insertarlo
en la lista de los programas de aplicación.

Si tiene el icono en el escritorio, haga doble clic en él. De otra manera debe usar la
siguiente secuencia: <Start> - <Programs> - <Minitab for Windows> - <Mintab>; si su
Sistema Operativo está en español:

<Inicio> - <Programas> - <Minitab for Windows> - <Mintab>

La ventana que se obtiene se conoce como la ventana principal del Minitab.

A continuación pasaremos a describirla.


2. Anatomía de la ventana principal
Al ejecutar el programa, en la pantalla se visualiza la ventana principal del Minitab.

La anatomía de esta ventana es similar a la mayoría de las ventanas conocidas:

La Barra de Titulo: Muestra el nombre de la Aplicación (Minitab) y el nombre de


la Hoja de trabajo. Si ésta aún no ha sido grabada, no tiene nombre, por lo que en ella se
visualiza: “Untitled”.

La Barra de Menú: En ella se muestra los comandos que nos permite realizar todas
las operaciones con nuestros datos

La Barra de Herramientas: Muestra los iconos que nos permite la ejecución directa de una
serie de acciones para una parte o la totalidad de los datos y resultados.

La Hoja de Trabajo: En esta ventana se almacenan todos nuestros datos y los


resultados de la ejecución de los comandos. Es, como se puede apreciar, una auténtica hoja
electrónica como, en el caso del Excel. Consta de un conjunto de celdas referenciadas por una
fila y columna determinadas. Los datos se ingresan por fila o por columna (que es el caso
común). El resultado de todos los comandos y acciones que pueden llevarse a cabo en Minitab,
están contenidas en una hoja. Su tamaño asignado por omisión es de 100,000,000 filas y 4000
columnas. Naturalmente que, como en el Excel, se pueden tener abierto varias hojas de trabajo
simultáneamente.

La ventana Sesión: Podríamos decir que esta ventana fundamenta el carácter


interactivo del Minitab. En ella se muestra la secuencia de comandos que se ejecutan
transparentemente cuando alguna acción es llevada a cabo en la Hoja de Trabajo. La
llamaremos también Ventana de Comandos ya que ella será usada para ingresar los comandos
que se ejecutan de modo interactivo. Si bien es cierto que mediante los comandos de la barra
de menú se puede explotar toda la capacidad del Minitab, hay situaciones en las que el usuario
puede requerir de la ventana de sesión para ingresar directamente una o más secuencias de
instrucciones a las cuales se les conoce como comandos interactivos. Por ejemplo si
deseamos realizar un determinado cálculo entre el contenido de ciertas celdas para dejar el
resultado en otra celda en particular, nos veremos precisado usar esta ventana. Por lo demás,
el manejo de la barra de menú a través de la diversidad de ventanas que se genera, cubre
todas nuestras necesidades comunes.

La Barra de estado: En ella se muestra el nombre de la hoja activa. Durante el uso de


algunos comandos, se muestra la sugerencia de usar F1 para ayuda.

Nota:
La hoja de trabajo del Minitab es como una hoja del Excel. Podemos ingresar datos,
seleccionar, copiar o pegar desde un bloque o rango de columnas hacia otro, como en el
caso del Excel. Pero se distinguirá de éste, en el sentido que las celdas almacenan sólo
datos, no fórmula. Los gráficos necesariamente se muestran en otra ventana, no sobre la
misma hoja. Y cuando existe una celda vacía, dentro de una columna de datos, se
mostrará un asterisco “*”, excepto si se ha modificado para otro simbolo.

En la figura anterior se aprecia las otras ventanas asociadas a una sesión de Mintab,
las que pasaremos a describirlas.
Ventana de Información: Contiene toda la información de las columnas de cada
una de las hojas del proyecto.

Ventana de Historia: En esta ventana se muestra la secuencia de todos las


acciones y comandos usados durante la sesión de uso
del Minitab.

Ventana de Gráfico: En ella se aprecia los gráficos trazados durante la sesión.


Si no se cierran, todas ellas aparecen apiladas en la
pantalla. Por lo general, sólo una gráfica es trazada por
una secuencia de acciones; sin embargo puede
generarse más de un gráfico en la misma ventana como
es el caso que se muestra en la siguiente figura número
3.

Observaciones:

1. Pertenezcan o no al proyecto activo, en una sesión de trabajo se pueden tener


abiertas más de una hoja de trabajo, una de las cuales será la hoja activa.
2. La ejecución de todos los comandos afecta sólo a la hoja de trabajo activa. Por
supuesto que si mediante la calculadora se realiza una operación y el resultado
se almacena en una variable, la hoja no será afectada. Cuando se grabe la hoja, y
más tarde se quiera volver a usarla, no se dispondrá de la variable. Pero si se
hubiera grabado como proyecto, al abrir éste, sí se dispondrá de la variable, con
el último valor almacenado en ella.
3. Si desea activar una hoja de trabajo, haga clic en la parte que vea de ella o use el
comando <Ventana>. También puede usar <Ctrl.> + <F6>, o hacer clic en el
icono de la esquina superior de la hoja activa y seleccionar la opción
<Siguiente>.

3. Dar nombre a una columna


El Minitab define a cada una de las columnas con la etiqueta: Cn; donde n indica el número de
columna.

Nosotros como usuario también podemos darle nombre a una columna. Para ello es
suficiente:

1. <Hacer clic en la celda debajo de la columna especificada>

Ejemplo: En C1

2. Digitar el nombre que deseamos darle. Ejemplo: Ventas

3. Presionar <Enter>

Nota:

1. El nombre de una celda se puede ingresar desde la ventana de sesión. Por ejemplo si C1
debe definirse como “Descripción”, debemos digitar en la ventana de sesión: NAME C1
‘Descripcion’ o también NAME C1 ‘Descripcion’

2. El contenido de una celda particular puede ser Dataulada mediante el uso de comando
ingresados en la Ventana de Sesión. Para hacer referencia de una celda se debe indicar la
columna y entre paréntesis, el número de la fila. Por ejemplo Cx(y), hace referencia a la fila
‘y’ de la columna ‘x’ , de manera que podríamos dejar en la fila 5 de la columna 2, la suma
de la columna 3; para ello, ingresamos el comando: Let C2(5) = Sum(C3).

3. Recuerde que antes de usar la ventana de sesión para ingresar comandos, debe activarla:
hacer clic en alguna parte de ella y luego <Editor> - <Enable Command language>.
4. Cuando se ingresa algún valor en una determinada celda de una columna, todas las celdas
anteriores se rellenan con “*”.

4. Amplitud de una columna


La amplitud o ancho de una columna, definida por omisión, es de 8 caracteres (bytes).
Este tamaño se puede modificar usando una de las siguientes formas:

a) Automáticamente, después de ingresar el dato o nombre y presionar <Enter>

b) Tocando con el puntero del ratón la división de columna, en su nombre o etiqueta y,


cuando se convierta en una flecha de doble sentido, arrastrar hacia la izquierda,
para reducir, o la derecha, para aumentar (Figura anterior)

c) Usando la opción <Column> del comando <Editor>. Lo veremos luego.

Nota:

1. El tamaño de cada columna, por omisión está especificada en 8 carateres.

2. Cuando la columna contiene datos numéricos puede ocurrir que, al realizar algún cálculo, en
algunas de sus celdas se visualice “******”. En este caso se debe ampliar también el tamaño
de dicha columna.

5. Contenido de una celda

El contenido de una celda constituye un dato. El Minitab reconoce tres tipos de datos:

- numéricos
- de tipo texto(o cadena de caracteres)

- de tipo fecha y/o tiempo.

El dato numérico puede ser entero o flotante (con decimales). Cuando la cantidad es
suficientemente grande, su resultado se visualiza en formato científico de la
forma a.bcdEn.

El dato de tipo texto está formado por una cadena de caracteres válidos. El espacio en
blanco es una cadena de caracter.

Los datos de tipo fecha o tiempo (Date/Time) contienen diversos formatos de fecha o
tiempo como son mm-dd-yyyy , mm/dd/yyyy y otros, en el caso de fechas y, hh:mm:ss
en el caso del tiempo.

6. Ingreso de datos

Los datos se pueden ingresar a una Hoja de Trabajo de dos maneras:

 Desde el teclado
 Usando comandos

Ingreso de datos desde el teclado

Para ello simplemente elija la columna y la fila a partir del cual desea almacenar los
datos, digite el dato y luego presione <Enter> o la tecla guía correspondiente al sentido
de ingreso de los siguientes datos, excepto flecha a la izquierda.
Al presionar <Enter>, por omisión el cursor activa la siguiente fila de la columna, hacia
abajo. De manera que , en este caso, es suficiente presionar <Enter> para continuar con
la secuencia. Si desea continuar ingresando datos en la columna de la derecha, es
suficiente presionar <CTRL.> + <Enter>

Ejemplo 01:

Ingrese los datos del siguiente cuadro en las correspondientes columnas y filas que se
muestran en el mismo.

Procedimiento:

Primero ingrese los nombres de las columnas:

Clic en la celda debajo de C1

- Digitar Productos

- Presionar <Enter>

Repetir la secuencia para C2, C3 y C4

C1 C2 C3 C4

Productos Cantidad Precio($) Descuento


1 Teclado PS/2 50 15 0
2 Monitor Samsung 15” 40 130 12
3 CPU Intel Pentium V 130 520 20
4 CPU Intel Pentium IV 160 480 10
5 Monitor LG 17” 86 120 8
6 Disco duro 40 Gb 190 260 10
7 Disco duro 5Gb 90 80 20
8 CPU Intel Pentium III 65 450 10
9 Disco duro 20 Gb 120 220 10
10 Fax/Modem LG 56 Kbps 250 180 15
11 Fax /Modem NN 56 Kbps 240 150 15
12 Lector CD LG 52X 350 120 15
13 Micrófono Mutex 100 18 12
14 Tarjeta de sonido Ondex 75 60 10
15 Lector CD Creative 52X 300 90 20

7. Breve descripción de los comandos de la Barra de


Menú
A continuación pasamos a describir las principales opciones de los comandos de la barra
de menú a fin de tener una idea básica de su utilidad. Muchos de ellos tienen las mismas
funciones comunes a los que podemos encontrar en otras aplicaciones.

8. Comando <FILE>
Para abrir, grabar, imprimir archivos que contienen hojas de trabajos, gráficos o
proyectos, usaremos el comando FILE.

Para manejo de Proyectos: Usaremos:

La secuencia Es usado
<File> - <New..> Para crear una nueva Hoja o un Nuevo Proyecto
<File> - <Open Project> Para abrir un proyecto previamente grabado
<File> - <Save Project> Para grabar el proyecto activo(en uso)
<File> - <Save Project Para grabar con otro nombre al que está en uso
As…>

Para manejo de Hojas de Trabajo: Usaremos:

La secuencia Es usado para


<File> - <Open Worksheet> Para abrir una hoja de trabajo ya grabado
<File> - <Query Database(ODBC)> Abre una base de datos para una consulta
<File> - <Save Current Worksheet> Grabar la hoja de trabajo o proyecto (en uso)
<File> - <Save Current Worksheet Para grabar la Hoja de trabajo(en uso)
as...>
<File> - <Save Project As…> Para grabar con otro nombre (en uso)
<Close Worksheet> Cierra la hoja de trabajo activa

La ventana que se obtiene al hacer clic en el comando <File> es la que se muestra en la


siguiente figura.
Observe que las opciones de este comando están agrupadas por el uso que se den:

- Para manejo de proyectos

- Para manejo de hojas de trabajo

- Para manejo de gráficos

- Para imprimir

- Para cerrar el Minitab

- Para acceder a los archivos recientemente usados

Otras Opciones adicionales:

<Open Graph> Abre un gráfico en Minitab, previamente grabado

<Other Files> Permite importar/exportar archivos de tipo texto

<Print Worksheet> Imprime una hoja de trabajo


Nota Importante:

1. Todos los archivos(Hojas de trabajo (*.Mtw o Proyectos *.Mpj) que usaremos en el estudio
del Minitab, se encontrarán en la carpeta “Tutor Minitab”, que se encuentra en la unidad C.

2. Todos los proyectos u Hojas de trabajo que debemos grabar se deberán hacerlo en la misma
carpeta.

Ejemplo 02:

Grabe su hoja de trabajo con el nombre “Ses01” usando la secuencia

<File> - <Save Current Worksheet...>.

Puesto que el archivo no tiene nombre, en la siguiente ventana que salga, debemos
indicarle la carpeta y el nombre que va a tener. En el recuadro “Guardar en” ubique la
carpeta donde desea guardarlo, en el recuadro Nombre del archivo digite “Ses01” y
luego haga clic en el botón <Save>

Diferencia entre <Save Current Worksheet > y < Save Current Worksheet as>:

Vuelva a grabar la hoja usando <Save current WorkSheet>

Como ya la hoja tiene nombre, no aparece la ventana anterior.

Si tuviéramos que grabarla con otro nombre, entonces deberemos usar la secuencia

<File> - <Save Current Worksheet As ...>

para que pida el nombre. (Lo que también podríamos aprovechar para cambiar de
unidad, por ejemplo grabarlo en otra unidad diferente a la de uso).

Cierre su hoja actual usando

<File> - <Close Worksheet>

Ahora abra el archivo “ProdPc.Mtw” que se encuentra en la misma carpeta.

Abra también el archivo recientemente grabado “Ses01.Mtw”. Para ello use

<File> - <Open Worksheet>

Ubique el nombre del archivo en la carpeta arriba mencionada

Activar/Desactivar cada una de las hojas cargadas a memoria:

Grabemos ahora todas las hojas como un proyecto llamado “Proy01”. Use la secuencia:
<File> - <Save Project as>. Como el proyecto no tiene nombre, se puede usar también
<File> - <Save Project>. A continuación ubique la unidad y carpeta donde desea
guardar y en <File name> digite Proy01. Ahora puede ver en la barra de título, el
nombre del proyecto.

Cierre el Minitab.

Vuelva a ejecutar el Minitab. Abra el proyecto Proy01.mpj usando la secuencia <File> -


<Open Proyect>. Ubique la unidad y carpeta y luego seleccione el archivo Proy01.mpj.

Se puede observar que el Minitab ha cargado a memoria las dos hojas de trabajo contenido en
el proyecto.

9. Comando <EDIT>
Para hacer algunas operaciones sobre el contenido de las hojas vamos a estudiar las opciones
principales que tiene el comando EDIT. Podemos copiar, pegar, cortar celdas.

Las principales opciones que tiene este comando son las siguientes

La secuencia Es usado para


<Edit><Clear Cells> Limpiar el contenido de una celda(Se inserta un *)
<Edit><Delete Cells> Eliminar la celda especificada(las otras se reordenan)
<Edit> <Copy Cells> Copiar a memoria el contenido de la(s) celda(s)
<Edit><Cut Cells> Copiar y elimina la celda con su contenido
<Edit> <Paste Cells> Pegar aquello que se copió o cortó, a partir del cursor
<Select All Cells> Seleccionar toda la hoja de trabajo activa

La figura que se muestra a continuación nos permite visualizar las opciones obtenidas
al hacer clic sobre el comando EDIT.
Ejemplo 03

Si Ud. observa, la hoja Ses01 contiene una columna de Descuentos (C4), pero la hoja ProdPc, no
tiene. Vamos a copiar la columna Descuentos de Ses01 hacia la columna 4 de ProdPc.

1. Active la Hoja de trabajo Ses01.Mtw

2. Seleccione toda la columna C4 haciendo clic en la etiqueta

3. Copie toda la columna C4 usando <Edit> - <Copy Cells>. Puede usar también la
forma clásica de copiar: <CTRL>+C.

4. Ahora active la Hoja ProdPc.MTW y haga clic en la etiqueta C4

5. Pegue lo copiado en dicha columna usando <Edit> - <Paste Cells> o use <CTRL>+V.

Nota:
Por supuesto que puede usar cualquier otra forma de copiar y pegar que Ud. sepa; usando
los iconos de la barra de herramientas, por ejemplo.
Ahora vamos a copiar hacia otra hoja de trabajo nueva.

Podríamos crear la hoja nueva y luego copiar, o podríamos copiar y luego crear. La secuencia es
indiferente, lo copiado permanece en memoria hasta que no se vuelva a copiar otros datos.

6. Active la Hoja Ses01.Mtw

7. Seleccione toda la hoja usando <Edit> - <Select all cells>. (Como podrá apreciar, los
nombres de las columnas no quedan seleccionadas y además, sólo queda seleccionada el
rango de datos, no toda la hoja) y luego copie usando <Edit> - <Copy Cells>.

8. Abra una nueva hoja usando la secuencia <File> -


<New>

Como puede ver en la ventana adjunta.

Podemos crear un nuevo proyecto, o una nueva hoja.


Seleccionaremos hoja usando:

- <Mintab Workshhet> - <Ok>

9. Haga clic en la primera celda de la columna C1 y pegue lo copiado usando la opción <Paste
Cells> de <Edit>.

10. Vuelva Ses01.Mtw y copie los nombres de las columnas hacia la nueva hoja y grabe a
ésta como WSes01.

11. Grabe el proyecto para guardar las modificaciones de una de sus hojas.

Nota:
Para pasar de una hoja de trabajo a otra (en realidad de una ventana del Minitab a otra del
mismo) use las teclas: <CTRL>+<F6>.

Nota:
Observe que en la barra de titulo de la hoja de trabajo aparece el nombre de la hoja, mientras que
en la barra de titulo del proyecto(ventana principal), aparece el nombre del proyecto.

10. Comando <DATA>


Ahora vamos a describir el comando DATA que nos permitirá el manejo de los datos dentro de la
hoja. Como veremos, se puede crear “Subhojas”, juntar, separar columnas, ordenar los datos,
eliminar filas, borrar variables, codificar, cambiar el tipo de dato, etc. En las versiones anteriores
este comando era DATA.
Use este comando
para extraer o
copiar, para cortar
o excluir un
subconjunto de
datos de la hoja
activa. Igualmente
puede usar para
ordenar e imprimir
toda o parte de la
hoja. También
puede cambiar el
tipo de formato de
sus datos.

La figura anterior
muestra una lista
de algunas opciones de este comando.

Note también que las opciones están agrupadas por categoría de función: Para manejo de Hoja,
manejo de columna, para variables y celdas y para visualizar los datos.

La secuencia Es usado para


<Data><Subset Worksheet...> Extrae/Copia parte de la hoja, de manera especial
<Data><Split Worksheet...> Extrae parte de la hoja con columnas completas
<Data><Sort> Ordena la hoja activa o nueva por algún criterio
<Data><Rank> Genera conjunto de índices de posición de datos
<Data><Delete Rows...> Borra filas especificadas, reordenando las restantes
<Data><Erase Variables...> Elimina la variable(columna), no reordena columna
<Data><Copy Columns...> Copia columnas hacia otras, condicionalmente
<Data><Stack/Unstack> “Apilar/Desapilar” columnas para formar otra(s)
<Data><Concatenate> Añade o “suma” dos o más columnas hacia otra
<Data><Code> Permite codificar una columna determinada
<Data><Change Data Type> Cambia el tipo de dato(Numerico/Texto/Fecha)
<Data><Display Data...> Imprime el contenido de columnas seleccionadas
<Data><Transpose columns…> Permite transponer filas a columnas o viceversa

Ejemplo 04
Vamos a extraer una parte del archivo Familia.mtw y almacenarlo en una hoja nueva

Abra el archivo Familia.Mtw usando

<File> - <Open Worksheet>

Seleccione la unidad y carpeta donde se encuentra el archivo mencionado.

Como puede apreciar, en esta hoja tenemos, en la columna C2, la variable Sexo, en el cual los
datos son: “M” y “F”.

Vamos a crear una nueva hoja que contenga sólo a los hombres (“M”) y otra que contenga a las
mujeres (“M”).

Para ello debemos usar:

<Data> - <Subset Worksheet>. Completemos los datos en la siguiente ventana:

a) El nombre de la nueva hoja debe ser Hombres.

b) Debe estar activada: <Specify wich rows to included> de la opción <Include or Exclude>. Es
decir, debemos indicarle las columnas a ser incluidas.

c) Haga clic en <Condition> de la opción <Rows that match>

d) En la siguiente ventana, en el recuadro Condition se debe tener la condición de comparación.


En este caso son todos los alumnos cuya variable sexo es igual a “M”; es decir, Sexo = “M”.
Observe la siguiente imagen.

e) Ahora haga clic en <Ok> para volver a la ventana anterior y luego <Ok>
Ejercicio
Obtenga una nueva sub-hoja llamada “Mujeres” en la que sólo estén los de sexo femenino. Que la
nueva hoja se llame Mujeres.

Active la hoja Hombres. Extraiga a todos aquellos que provienen de las escuelas públicas (Escuela
= “Priv”). Que la nueva hoja se llame Escuela Privada

Ahora vamos a extraer los datos por Sexo y por Escuela. Para ello

- Active la hoja original Familia.Mtw

- Use la secuencia :

<Data> - <Split Worksheet...>

- En la ventana siguiente seleccione las variables Sexo y Escuela

- Cierre estas cuatro hojas sin grabar o guardar

Trabajemos ahora con otra base de datos:

- Abra la hoja llamada Sec405.Mtw


Como podrá apreciar, esta hoja contiene los nombres de los alumnos y el total de créditos en los
que están matriculados; sólo que están separados por sexo.

- Copie todos los datos (incluyendo los nombres de las columnas) hacia una nueva hoja de
trabajo.

1. Seleccione las cuatro primeras columnas y luego copie.

2. Use <File> - <New> - <Minitab worksheet> - <Ok> para abrir una nueva hoja de trabajo.

3. Haga clic debajo de la columna C1 y pegue lo copiado

- En esta nueva hoja vamos a juntar (Stack) la columna C1 con la columna C3 y lo


almacenaremos en la columna C6.

- Usemos la secuencia <Data> - <Stack> - <Stack Columns…>

- En la siguiente ventana, debe rellenar los datos según como se muestra en la siguiente figura

- En el recuadro de <Stack the following columns> ingrese las columnas Varones y Mujeres

- Usaremos la columna C6 para apilar. Activar <Column of current worksheet> e ingresar la


columna C6

- Puesto que los subíndices pueden servir para identificar el tipo de dato en C6, almacenaremos
los subíndices en C8. Esto lo hacemos ingresando C8 en el recuadro <Store subscript in:>

-
Haga clic en <Ok>

- Haremos lo mismo con las columnas de créditos y la colocaremos en C7. En este caso deje en
blanco el recuadro <Store subscript in>, no lo necesitamos.

- Ponga por nombre Alumnos, Créditos y Sexo a las columnas C6, C7 y C8, respectivamente.

Use la opción SORT para ordenar los datos

Ahora vamos a ordenar alfabéticamente estas columnas

- <Data> - <Sort>

- En la ventana siguiente, en el recuadro <Sort columns(s)>, ingrese las tres columnas: Alumnos,
Créditos y Sexo.

- En el recuadro <Store sorted data in> o “Almacenar lo sorteado en”, ingrese las celdas C10 C11
C12.

Ejercicios

- Cierre esta hoja sin grabar y vuelva a la Hoja Sec405.

Ejecute por favor las siguientes peticiones:

- Ordene sólo las columnas de los varones con sus respectivos créditos sobre las
mismas columnas.

- Haga lo mismo con las columnas de las Alumnas

- Ahora, apile (Stack) a todos los alumnos en la columna C6, a los créditos en C7 y
haga que la columna C8 contenga el sexo de los alumnos.

Borrar variables

Para borrar celdas con datos puede usar el comando <Edit>, donde
<Edit> - <Erase cells> permite borrar el contenido de las celdas seleccionadas y
reemplazar su contenido con “*”

<Edit> - <Delete cells> permite eliminar la celda reordenando hacia arriba las celdas
restantes.

Nota:
Si selecciona toda la columna y usa <Erase cells> borrará toda la columna,
dejándola vacía

Si selecciona toda la columna y usa <Delete cells> suprime la columna y las


columnas de la derecha se reordenan hacia la izquierda

Como se puede ver, Erase y Delete son opciones del comando Data usados para
diferentes propósitos.

Usaremos

<Data> - <Erase variables> para borrar una o más variables (columnas)

Usaremos

<Data> - <Delete rows> para borrar una o más filas de una columna o varias,

reordenando las filas hacia arriba.

- Para borrar las columnas C1-C4 usaremos la secuencia

<Data> - <Erase variables>

En <Columns, constant and matrices to erase> ingresamos C1-C4

Hacemos clic en <Ok>

Usted puede verificar que las columnas persisten pero sin datos

- Eliminemos ahora las columnas C1 – C4. Para ello seleccionamos toda la


columna C1 hasta C4. Usemos ahora <Edit> - <Delete Cells>

- Grabe la hoja restante con el nombre Alumnos405

Imprimir o visualizar variables


Para terminar, vamos a imprimir en pantalla todas las columnas. Para ello usaremos
la secuencia:

<Data> - <Display Data>

Ahora seleccionaremos todas las columnas, en el orden en el que queremos


visualizarlas.

Vamos a ordenar nuestros datos por sexo y dentro de ello por nombres (campo Alumnos). En el
primer recuadro <Sort by column> o “Sortear por columna: “ ingrese la columna Sexo y en el
siguiente recuadro ingrese Alumnos. Su ventana debe quedar como indica la siguiente figura

- Luego haga clic en <Ok>

La hoja Ordenados.mtw contiene la solución.

Ejemplo 05
Abra el archivo “Emple01.Mtw”. La información contenida en ella se refiere a los empleados de
una tienda comercial del Centro de Lima. Usando todo lo que hasta aquí hemos aprendido,
resuelva cada una de los siguientes ejercicios.

a) Convierta los datos contenidos en la columna C5 de numérico a texto. Luego reemplace


los valores de acuerdo a la siguiente equivalencia:

0 Sin instrucción

1 Primaria completa

2 Secundaria completa

3 Estudios en Institutos

4 Estudios Universitarios

5 Bachiller

6 Titulado

7 Maestría

8 Doctorado o equivalente

9 Otras especializaciones

b) Copie los datos “Tiempo de Serv.” , columna C4, hacia la columna C9. Qué ocurre con
el nombre de esta nueva variable?

c) Obtenga una nueva hoja que contenga a todos los empleados cuyo tiempo total de
trabajo (tiempo de servicio en la tienda más experiencia previa) sea mayor o igual a 18
años.

d) Si el propietario de la tienda decide premiar con un básico a todos los empleados


mayores de 40 años, a cuántos y a quiénes debe premiar?. Extraiga hacia una nueva
hoja a los que cumplen dicha condición.

Solución
a) Para resolver esta pregunta debemos cambiar el tipo de datos de Numérico a Texto: Para ello
use la siguiente secuencia: <Data> - <Change data type> - <Numeric to Text>

Complete la información de la siguiente ventana según se muestra en la figura

Ahora vamos a codificar esta columna que ya es de tipo texto.

Para ello usaremos siguiente secuencia:

<Data> - <Code> - <Text to Text>

A continuación debemos llenar los datos según se indica en la siguiente figura.


b) Esta pregunta podemos resolverla de varias maneras. Usemos la siguiente:

Seleccionemos la columna C4, haciendo clic en su etiqueta

Copiamos la columna haciendo clic en el botón

Hagamos clic en la etiqueta C9

Pegamos lo copiado usando el botón

Se puede observar que el nombre es diferente “Tpo. Serv_1”

c) En este caso usaremos la siguiente secuencia:

<Data> - <Subset WorkSheet>

Dejamos el nombre de la nueva hoja como está y en <Condition> pondremos 'Tpo. Serv.'>=18

d) Dejamos como ejercicio para el lector.

Abra el proyecto Proy02.mtw y usando <CTRL>+<F6> podrá observar los resultados.

Ejemplo 06

La inmobiliaria “Hogar dulce Hogar” está interesada en realizar un estudio sobre el monto de
rebaja que experimenta el precio de sus inmuebles entre el momento en que el cliente consulta y
el precio final de contrato. Una primera posibilidad de estudio es extraer y separar de su base de
datos “InmbHogar.Mtw”, a todos aquellos que adquieren el inmueble al mismo precio de consulta
y los que solicitan un descuento. Use el Minitab para resolver esta inquietud.

De aquellos que compraron sin descuento, imprima en pantalla los siguientes datos: Precio de
Venta, Nro. de baños y Capacidad de la cochera
Solución:

Use <Data> - <Subset WorkSheet>. En <Condition> ingrese: 'Pr. Venta'='Pr. Consulta'.

Ejemplo 07

Si no estuviera abierto el archivo “InmbHogar.Mtw”, vuelva a abrirlo. Vamos a codificar la


columna “Sótano” de acuerdo a la siguiente tabla:

Nro. sótano Nuevo Código


0 Sin sótano
1 Un nivel
2 Dos niveles
* Sin datos

Para ello debemos hacer uso de la opción <Code> del comando <Data>. La siguiente ventana
muestra los datos que se debe ingresar para obtener lo pedido.
En <Code data from column> ingresamos la columna C6 ó “Sótano”.

En <Into columns> ingresamos la columna que debe contener el “Nuevo código”

En los siguientes espacios ingresamos los datos de la tabla

Hacemos clic en <Ok> para obtener los resultados.

11. Comando <CALC>>


Este es el primer comando que permite realizar una gran diversidad de tipos de cálculos
estadísticos. Podemos realizar cálculos estadísticos por fila o por columna; podemos generar un
conjunto de datos numéricos o de tipo fecha; igualmente podemos obtener distribuciones de
probabilidad y evaluar probabilidades; y si aún el cálculo que debemos realizar no puede ser
resuelto por la vía de comandos, podemos hacer uso de la calculadora.

Nota:
Mucho de estos cálculos se pueden realizar también mediante el lenguaje de comandos
ingresados en la Ventana de Sesión, al estar activado el modo de ingreso de comandos.
Recuerde que para activar este modo debe hacer clic primero en la Ventana de Sesión y
luego usar <Editor> - <Enable Command Language>.

La figura siguiente muestra las opciones que tiene este comando.


Observe que estas opciones están agrupadas en cuatro grupos de categorías:

- Para realizar cálculos estadísticos

- Para generar datos usando algún criterio

- Para generar y trabajar con distribuciones de probabilidad

- Para trabajar con matrices

A continuación describiremos algunas de estas opciones.

<Calculator> Permite realizar una serie de operaciones aritméticas sobre los datos de la
hoja. Estos cálculos pueden incluir el uso de una o más funciones
aritméticas, trigonométricas, estadísticas, de fecha/hora, estaídistica por
fila, así como ordenar columnas.

<Column Statistics..>Esta es la primera opción del Minitab que permite obtener un conjunto de
resultados estadísticos sobre una determinada columna. Se puede obtener
el total, la media, la desviación estándar, rango, el valor máximo, valor
mínimo, la mediana, la suma de los cuadrados, etc. En cada operación sólo
se puede calcular un estadístico.

<Row Statistic...> Como en el caso anterior, permite obtener estadísticos por fila. Un
estadístico de los mencionados en la opción anterior, por columna.

<Standardize> Genera una variable estandarizada centrada en la media. Es útil en el caso


de la distribución normal, para obtener Z con distribución normal (0, 1) y en
general para resolver inferencia estadística
<Make Patterned Data> Genera un conjunto de datos simples o arbitrarios
de tipo numérico o fecha.

En la figura anterior podemos observar que se puede generar conjunto simple de números
<Simple Set of Numbers...>, tales como 0, 1, 2, 3, ... ó 7, 13, 19, 25, ...

Igualmente se puede generar un conjunto arbitrario de datos numéricos usando la opción


<Arbitrary Set of Numbers>.

Si desea ingresar una columna de datos literales, como nombre de meses, productos,
personas, etc. use <Text Values>.

Se puede generar un conjunto de fechas como una secuencia de valores numéricos.

<Set Base> Permite ingresar una semilla para la generación de una nueva secuencia de
números aleatorios.

<Random Data> Permite generar diversos tipos de datos aleatorios: Binomiales, de tipo
Poisson, Normales, Beta, etc.

<Probability Distributions> Permite construir una distribución de probabilidades sea


Binomial, Poisson, Entero, Normal, Exponencial, Cauchy,
etc.

La siguiente figura muestra las diferentes opciones que tiene estas dos opciones.
<Matrices> Permite leer, realizar operaciones con matrices

EJEMPLO DE USO DE <CALCULATOR>:

Con el <Calculator> podemos realizar diversos tipos de operaciones aritméticas con las
columnas de la hoja y dejar el resultado en una nueva columna o en la misma; se puede
almacenar el resultado en una variable, cuyo valor se guarda en una nueva columna
disponible.

En las expresiones aritméticas que use se pueden incluir diversos tipos de funciones
soportadas por el Minitab.

Ejemplo 08

Supongamos que una columna contiene los valores de una variable aleatoria X, almacenada en la
columna C1. La columna C2 contiene los valores de las probabilidades para X = x; como se puede
visualizar en el archivo LDistrib01.Mtw. Queremos calcular la varianza de X, sabiendo que V(X) =
E(X²) – [E(X)]².

Para ello siga los pasos indicados:


Paso 01: Abra el archivo LDistrib01.Mtw.

Vamos a calcular la varianza de una manera detallada, usando columnas de trabajo. Para ello
debemos calcular en C3 el producto de X*P(X = x), para luego calcular la suma con SUM(C3), que
será igual a E[X]. Del mismo modo calculemos en C4 el producto X*X*P(X = x), para luego calcular
SUM(C4), que representará E[X²]. Finalmente obtendremos V[X] = E[X²] – (E[X])² y el resultado lo
guardaremos en una variable cualquiera como R.

He aquí la secuencia de operaciones:

Paso 02: Calcularemos el producto de X por P(X = X). Usemos la siguiente secuencia

<Calc> - <Calculator>.

En <Store result in variable> ingrese C3

En <Expression> ingrese la operación: X*P(X=x) Seleccione la celda del lado izquierdo en


lugar de digitar

<Ok>

Paso 03: Ahora calcularemos X² por P(X = x). Usemos la siguiente secuencia:

<Calc> - <Calculator>

En <Store result in variable> ingrese C4

En <Expression> ingrese la expresión aritmética: X*X*P(X=x)

<Ok>

Paso 04: Calcularemos la diferencia E[X²] – (E[X])². Usemos la siguiente secuencia:

<Calc> - <Calculator>

En <store result in> ingrese, R (una variable cualquiera)

En <Expression> ingrese la expresión: Sum(C4) – (Sum(C3))**2

<Ok>

Verá que el resultado está en R que es el nombre que el Minitab le asigna a la primera celda de la
primera columna disponible y que se encuentra a la derecha de los datos.
Observación:

Si en lugar de R hubiéramos usado K1, el valor sería almacenado en esta variable y no en una
celda de Minitab. Es más conveniente esta modalidad ya que si más tarde usa dicha columna, el
valor de R se perderá.

Para visualizar el valor de K1, se debe usar:

<Data> - <Display data>

Seleccionar la o las variables que se deseen visualizar y luego clic en <Ok>

Nota:

1. Otra forma de calcular la varianza directamente, sin usar columnas de trabajo del la hoja
es:

2. <Calc>-<Calculator> En <Store results> V en <Expression> digitar la expresión:


SUM(C1*C1*C2)-SUM(C1*C2)**2. Luego <Ok>

3. Si construye una expresión aritmética como la anterior, es mejor usar la etiqueta de la


columna en lugar del nombre complementario, salvo que la use seleccionando y no
digitando.

Ejemplo 09

1. Usando el ya clásico “COPY – PASTE”, ingrese en las columnas C1 y C2, los siguientes datos que
se encuentran en el archivo Lista de faltas.doc

Pamela 12
Carlos 16
Miguel 10
Sandra 7
Felipe 2
Alonso 12
Karla 25
Yacole 18
Baslavi 9
Isabel 12
Lorena 4
Mariella 13
Eduardo 8
Mario 16
Rodrigo 7
Sandra 24
Victor 18
Enrique 14
James 6
Alvaro 17

Solución

Paso 01: Usando Word abra el archivo Lista de faltas.doc

Paso 02: Seleccione las dos columnas. Copie

Paso 03: Active su hoja en Minitab; luego haga clic en la celda A1

Nota:
1. Por supuesto que también puede ingresarlos directamente
2. La primera columna también puede ingresar usando la secuencia

<Calc> - <Make Patterned Data> - <Text Values…> y en el recuadro “Text Values” digitar los
nombres separados por un espacio en blanco, aunque su tamaño es limitado y su uso se remite
sólo a datos de texto que no tienen espacios en blanco.

2. Obtener el porcentaje de faltas en la columna C3

- Ingresamos el nombre de la columna C3: Porcentaje.

- Usamos la calculadora:

<Calc> - <Calculator>)

Ingresamos C3 para guardar el resultado del cálculo

- En <Expresión> ingresamos C2/Sum(C2)

- <Ok>

3. Ordene todas las columnas alfabéticamente(por la columna C1)

4. Grabe su hoja con el nombre Faltas.mtw


Ejemplo 10

Vamos a crear una hoja de trabajo que contenga el ingreso mensual, en miles de dólares, que una
compañía exportadora obtuvo durante los años 1991 a 2002. La columna C1 contendrá los meses,
las columnas C2 hasta C13 los años.

- Abra una nueva hoja de trabajo

- Ingreso de los meses:

<Calc> - <Make Patterned Data>

- En <Store patterned data in> ingrese C1

- En <Text values>, digite Meses Enero Febrero ... Diciembre

- <Ok>

- Ingreso de los años en cada columna:

- Seleccionamos 12 columnas haciendo clic debajo de la etiqueta de la columna C2 y


arrastrando hasta la columna C13

- Digitamos los años, presionando <Enter> en cada uno.

- Ahora vamos a generar supuestamente las ventas de un determinado producto durante


todos los meses de todos los años.

<Calc> - <Random Data> - <Integer> En <Generate> 12. En <Store in Columns>


C2 – C12. En <Minimum Value> 230. En <Maximum Value> 980.
Verifique sus datos con los de la siguiente ventana

- Grabe la hoja con el nombre de Ventas

Hasta aquí hemos querido presentar las diversas opciones de los comandos de la barra de Menú.
Para fijar ideas hemos desarrollado algunos ejemplos propios de cada comando y sus respectivas
opciones. Completaremos ahora el estudio de los comandos del Minitab sólo mencionándolos con
un breve comentario para luego realizar aplicaciones que requieran el uso de cualquiera de sus
opciones.

12. Comando <STAT>


Use este comando para obtener resultados como estadística básica, análisis de regresión, análisis
de varianza, diseño de experimentos, series de tiempo, etc.
Este es uno de los comandos que caracteriza al Minitab y que a la vez lo diferencia respecto a una
hoja de cálculo como el MS Excel. Y es el más importante por cuanto nos permite obtener un
conjunto de resultados que pertenecen a la Estadística Descriptiva así como la Estadística
Inferencial.

A continuación pasamos a describir sus opciones muy brevemente:

<Basic Statistics> Permite obtener un conjunto de indicadores estadísticos como la media,


mediana, desviación estándar, máximo, mínimo, cuartiles. Igualmente
permite obtener intervalo de confianza de varios modelos, realizar diversas
pruebas de hipótesis, correlación y pruebas de normalización.

<Regression> Realiza análisis de regresión lineal de múltiples variables; análisis bietápico,


estimación y ploteo de residuales y diversas formas de gráficos.

<Anova> Permite realizar análisis de varianza con diferentes formas de acceder al


modelo, enfocado desde el punto de vista del diseño de experimentos.

<DOE> Permite realizar diseño de experimentos para el estudio en forma simultánea


de varios factores.

<Control Charts> Realiza análisis gráfico sobre pruebas de estimadores.

<Multivariate> Realiza análisis de componentes principales, análisis factorial, análisis


discriminante, de conglomerdos en sus dos formas.
<Time Series> Realiza análisis de series de tiempo: análisis de tendencias,
descomposición, promedios móviles, alizamiento. También realiza
autocorrelación, ARIMA, etc.

<Tables> Permite realizar tabulación cruzada, prueba chi-cuadrado, análisis de


correspondencia simple y múltiple.

<Nonparametrics> Permite realizar pruebas sobre procedimientos estadísticos no-


paramétricos de tres tipos.

<Power and Simple size> Permite realizar cálculos sobre la potencia y tamaño de muestra para
ejecutar análisis prospectivos y retrospectivos.

En los próximos capítulos tendremos muchas oportunidades para practicar el uso de cada una de
las opciones del comando STAT.

13. Comando <GRAPH>


Este comando dispone de una gran cantidad de modelos diferentes gráficos y ploteos para la
diversidad de estimadores y múltiples pruebas realizadas sobre un conjunto de datos. A
continuación mencionaremos los más importantes.

Entre sus principales opciones tenemos:

<Scatterplot...> Traza un diagrama de dispersión de los datos.

<Matrix Plot...> Traza diversas formas de gráficos de una variable(Y) vs otra(X)

<Time Series Plot..>En este caso el tiempo se da en el Eje X

<Bar Chart> Genera diversos tipos de cuadro: de líneas, símbolos, etc.

<Histogram> Genera gráficos de barra para cada variable en el eje X


<BoxPlot> Permite construir Diagramas de Cajas en el cual se puede visualizar la
concentración de los datos al rededor de la mediana, el uso de los cuartiles
e igualmente si existen datos extremos o aislados llamados “outiliers”.

<Contour Plot...> Plotea gráfico de contorno al estilo de curvas de nivel, como gráficos
bidimensionales definido por tres variables X, Y, Z.

<3D Scatter Plot> Permite la construcción de gráficos tridimensionales

<DotPlot> Visualiza puntos por cada observación a lo largo del Eje X. Si hubieran más
de una ocurrencia, sobrepone los puntos.

<Pie Chart...> Permite construir gráficos de tipo torta con una serie de opciones disponibles.

<Steam and Leaf> Permite construir un tipo de gráficos de tallos y hojas.


14. Comando <EDITOR>
Este comando permite el manejo de columnas sea para definir su formato (número de decimales),
amplitud, insertar filas o columnas así como también mover columnas.

La siguiente figura muestra las opciones que tiene este comando

Usaremos

<Editor> - <Format column> Permite definir el número de decimales, si la columna debe


ser numérica, de tipo texto o fecha.

<Editor> - <Column> Si se necesita modificar la amplitud de la columna, esconder


o visualizarla.

<Editor> - <Insert rows> Si se desea insertar una o más filas

<Editor> - <Insert columns> Si se desea insertar columnas

Si se hace click en la Ventana de Sesión y luego se activa este comando se puede usar

<Editor> - <Enable Commands> Si desea usar la ventana de sesión para ingresar comandos
en modo Batch. Para ello, primero debe hacer clic en la ventana respectiva.
En los próximos capítulos haremos una descripción más detallada de los comandos <Calc> , <Stat>
y <Graph>

2. Gráficos en la Estadística Descriptiva (1)


En el primer capítulo nos hemos dedicado a la presentación del programa Minitab desde la
perspectiva de su funcionalidad así como las ventajas que pueden significar su utilización como
una herramienta de apoyo y de gestión en la estadística. Ahora que ya sabemos utilizar y
manipular algunos comandos, exploraremos algunos temas de la Estadística Descriptiva en todo
aquello en donde haya que realizar algún cálculo computacional. De manera que los temas a ser
tratados serán:

1. Uso de <Tally> para la obtención de estadísticas descriptivas

2. Use de <Sort> para el ordenamiento de datos

3. Gráficos de tipo <Plot> , <Chart> Configuración de la plantilla usada para la construcción de


gráficos

4. Configuración de la plantilla de gráficos. Opción <Layout>

5. Codificación de variables

6. Gráficos circulares(Pie Chart)

7. Diagrama de cajas

8. Introducción a Regresión

1. Uso de la opción <Tally>


Si de contar se trata, usaremos Tally en Minitab. Podemos contar datos numéricos y también
literales. Esta opción determina la frecuencia de veces que un dato u observación se presenta en
el grupo.

Como hemos visto antes, esta opción se encuentra dentro de las opciones de <Table>, en el
comando <Stat> y nos permite la obtener estadísticas sobre la
- frecuencia absoluta

- frecuencia absoluta acumulada

- frecuencias relativas

- frecuencia relativa acumulada

El siguiente ejemplo nos permitirá entender su importancia.

Ejemplo 1

El departamento de Admisión de la Universidad de Amazonas realizó una encuesta a los alumnos


ingresantes del año 1999. A cada uno de ellos de ellos se le presentó un cuestionario de 10
preguntas. La última columna contiene el tipo de movilidad con el cual se dirige a la Universidad:
1: Movilidad propia; 0: Vehículo público. Las respuestas obtenidas, se muestran en el archivo
Ingre99.Mtw.

Con la finalidad de detectar algún comportamiento respecto a los resultados del año anterior, se
decidió realizar un estudio estadístico descriptivo de estos datos.

A continuación trataremos de plantear una serie de preguntas y las resolveremos usando las
diversas herramientas que nos ofrece el Minitab.

1. Cómo obtener una distribución de frecuencias por edad? Cuántos alumnos son de sexo
masculino?. Cuál es el porcentaje de estudiantes mujeres?. Podríamos obtener el total de
alumnos que eligieron una determinada facultad?

Solución

La solución a este ejercicio lo haremos usando la opción <Tally> que está dentro de <Tables>,
del comando <Stat> el cual permitirá dar respuesta a las preguntas.
En efecto:

Para la tabla de frecuencia por edad, ejecutamos la siguiente secuencia:

<Stat> - <Tables> - <Tally>

Al pasar a la siguiente ventana

En Variables digitamos Edad

En Display seleccionamos Counts

Luego hacemos clic en <Ok>

Verifique el contenido de su ventana con la figura anterior.

Para saber el número de alumnos varones hay en la base de datos

Usamos al siguiente secuencia:


<Stat> - <Tables> - <Tally>

Variables: Sexo

Display: Counts

<Ok>

Podemos pedir que nos muestre porcentajes (frecuencia relativa) o total acumulado.

Para una tabla de frecuencia relativas (porcentajes) por sexo:

En este caso sólo cambiamos Display, donde activamos Percents. La secuencia es la siguiente:

<Stat> - <Tables> - <Tally>

En Variables: ingresamos Sexo

En Display: Activamos Percents

<Ok>

Para total de alumnos por facultad:

<Stat>-<Tables> - <Tally>

En Variables: ingresamos Facultad


En Display: Activamos Counts <Ok

2. Uso de <Sort> para ordenar datos


Sort en español significa ordenar, clasificar un conjunto de datos siguiendo algún criterio
de ordenamiento. Si los datos son alfabéticos, ordenaremos alfabéticamente, si fueran
numéricos, puede ser en forma ascendente o descendente (aunque lo alfabético también
puede ser de A a Z o al revés).

En muchas ocasiones el cálculo que debemos realizar requiere que los datos estén ordenados.

Para resolver todo problema de


ordenamiento el Minitab dispone de
la opción <Sort> que se encuentra
dentro del comando <Data>.

En la ventana de la derecha se
muestra los recuadros que debemos
llenar para que Minitab pueda
ordenar nuestros datos.

En <Sort columns> ingresaremos la


lista de las columnas (variables) a ser ordenadas.

En los cuadros de <By column:> debemos ingresar la columna que determina el criterio de
ordenamiento. El nivel de ordenamiento se define de acuerdo a esta lista. Se puede ordenar hasta
por cuatro columnas.

En <Store sorted columns> debemos ingresar las columnas donde debemos guardar los resultados
ordenados.

Para ver su aplicación desarrollemos el siguiente ejemplo

Ejemplo 2
Prosigamos con los datos del ejemplo anterior. Si el orden de importancia de las facultades
históricamente está determinado por el porcentaje de postulantes a cada una de ellas, cuántos
alumnos y en qué porcentaje eligieron las primeras dos facultades de mayor importancia?

Suponga que el orden de importancia viene dado por la siguiente secuencia: Medicina, Biotecnia,
Biología y Agricultura.

Solución

Si Ud. Observa los datos verá que no se encuentran ordenados por facultades. Esto implica que
debemos hacer uso de la opción SORT.

Seguiremos la siguiente secuencia:

Paso 01.

Puesto que al ordenar los datos sobre la misma hoja, se va a modificar la disposición original, o en
el peor de los casos, podemos perder algunos datos, por seguridad vamos a abrir una nueva hoja
de trabajo. Para ello usemos la siguiente secuencia:

<File> - <New> - <Minitab Worksheet> -<Ok>

*** Recuerde que debe copiar todos los datos hacia esta nueva hoja ***

Paso 02:

Debemos ordenar los datos por Facultad. Para ello usamos la siguiente secuencia:

<Manip> - <Sort>

En la ventana siguiente se debe ingresar la lista de las columnas sujetas al ordenamiento.


Como vamos a ordenar toda la tabla, en

<Sort column(s)> ingresamos todas las columnas. Para ello podemos seleccionar todas y luego
hacer clic en botón <Select>, como se muestra en la siguiente figura:
Después de seleccionar, debe aparecer Edad – Movilidad en el recuadro Sort column(s).

Como debemos ordenar por facultad, en <Store sorted column(s) in:> ingresamos C1–C10

Ahora debemos decirle al Minitab que queremos que ordene por Facultad, para ello en la primera
línea de <Sort by column:> ingresamos Facultad.

Dejamos “Descending” sin activar ya que deseamos que ordene de A hasta Z.

Finalmente hacemos clic en <Ok>

*** Observe que puede ordenar por varias columnas a la vez ***

*** Podríamos ordenar por Sexo, por Facultad, por Colegio y por edad ***

Paso 03:

Ahora debemos obtener frecuencias absolutas y porcentuales. Para ello usamos <Tally>. La
secuencia es la siguiente:
<Stat> - <Tables> - <Tally>

En <Variables> ingresamos Programa

En <Display> activamos todas las opciones <Ok>

3. Gráfico de tipo <Histogram>, <ScatterPlot> y


<Chart>
En muchos casos el comportamiento de los datos o la información obtenida a partir de ella, puede
ser rápidamente comprendida si los resultados cuantitativos se ven apoyados con una o más
gráficas del mismo. El Minitab proporciona una gran cantidad de tipos de gráficos para resolver
diferentes situaciones estadísticas.

A continuación pasamos a estudiar algunos tipos de gráficos que pueden ser usados en la
Estadística Descriptiva.

Gráfico de Histograma

Puesto que un histograma de frecuencias necesita el rango, número de clases, amplitud, etc.
primero obtendremos estos resultados.

Paso 01: Cargar el archivo DatObs.mtw del disco duro

Paso 02. Determinación de estos valores usando <Stat>

<Stat> - <Basic Statistics> <Display statistic descriptive>


En la ventana siguiente ingrese la columna Datos o C1. Hacemos clic en <Statistics> para pedirle
las estadísticas que deseamos calcular. En este caso deben quedar activadas Maximum, Minimum,
Range y N total, como se muestra en la siguiente figura.

Los resultados se muestran en el siguiente recuadro:

Descriptive Statistics: Datos

Total

Variable Count Minimum Maximum Range

Datos 50 34.16 72.24 38.08

Paso 03: Obtención del gráfico de Histograma

De acuerdo a los resultados anteriores, el límite inferior del primer intervalo es 34.16; el límite
superior del último intervalo es 74.24; el rango es 38.08 y el total de datos es n = 50.

La amplitud de clase lo encontramos dividiendo el Rango entre el número de intervalos de clase; en


este caso, entre 8; con lo que obtenemos 4.76 como amplitud.

Esta información vamos a ingresarla en la ventana del histograma.


Usemos la siguiente secuencia:

<Graph> - <Histogram>

En la ventana de diálogo que se muestra, se selecciona


<Simple> y hacemos Clic en <Ok>. En la siguiente
ventana, ingrese la variable como se muestra en la figura
de la derecha.

En <Graph variables> ingresamos el


nombre de la variable Datos . Luego
clic en <Ok>.

Al hacer clic en <Ok> se obtiene el siguiente gráfico de Histograma.


Observación importante:

En el gráfico podemos apreciar que en efecto hay 8 intervalos pero se muestra los puntos medios y
no los límites inferior y superior de cada intervalo. Más adelante veremos que, cuando se maneja
datos agrupados y se desea construir una tabla de frecuencias, se puede hacer a partir del
histograma obtenido.

Gráficas de tipo <ScatterPlot>

Usaremos la opción ScatterPlot cada vez que se desee obtener un gráfico que relacione una variable
contra otra. Por ejemplo, en los datos que estamos usando, nos interesaría saber cómo se comporta
el total de créditos en relación a la edad de los alumnos.

Ejemplo 3

¿Podríamos obtener algún tipo de gráfico que nos permita visualizar la relación que hay entre la
variable Edad y la variable Créditos del archivo Ingre99.mtw?

Solución

Comenzamos abriendo el archivo Ingre99.mtw. Graficar una relación entre dos variables significa
realizar un cruce entre ellas. Para ello haremos uso de la gráfica de tipo PLOT.

Plotearemos las variables Edad y Créditos de los alumnos de la base de datos Ingre99.mtw. La
secuencia <Graph> - <ScatterPlot> nos genera la ventana de la izquierda. Seleccionamos <Simple>
y hacemos clic en <Ok> para pasar a la siguiente ventana.

Ubicaremos la variable Edad en el Eje X y Créditos en el eje Y. Para ello es suficiente hacer
doble clic en Créditos primero y en Edad después.

Ahora debemos indicar la forma de gráfico de Plot que queremos:


Hacemos clic en <Data View> y luego en la ficha <Display> seleccionamos una opción del
conjunto:

Project

Connect

Lowess

Project

Symbol

La opción Project lines muestra la gráfica de las variables en forma de líneas verticales, lo que nos
permite comparar el número de créditos de los alumnos de acuerdo a la edad.

Por ello, seleccionemos la opción Project lines.

Luego de haber completado su selección, haga clic en <Ok>

Recomendamos que pruebe con las otras opciones y vea cuál se adapta a sus exigencias.

En el gráfico observe que hay una cantidad de créditos correspondiente al valor de las edades. Más
créditos llevan los alumnos entre las edades 18 y20.

Nota:

Y qué tipo de gráfico se habría mostrado si hubiéramos seleccionado en <Display> Symbol?

La siguiente figura responde a esta pregunta.


Observe la densidad de los datos en cada valor de la variable Edad. En la gráfica se muestra algunos
valores del número de créditos.

Podríamos decir que este tipo de gráfico nos permite observar la densidad de los datos por cada
cambio en la variable ubicada en el Eje X.

A continuación veamos el gráfico de tipo Chart

Gráfico de tipo Bar Chart:

Esta es también una de las formas clásicas de representar gráficamente una distribución de
frecuencias

El Minitab ofrece una diversidad de gráficos de tipo Chart que pueden ser usados para visualizar
nuestros datos.

Podemos obtener Charts de barras, de líneas, de áreas, de proyecciones y de símbolos. Estas


opciones son los equivalentes a los gráficos de tipo ScatterPlot.

Sin embargo en este caso, el tipo de gráfico Chart se fundamenta en aquello que se quiere graficar:
Puede graficarse como variable a la frecuencia de los datos

Puede graficarse como variable a la suma de los datos, la media, mediana, desviación estándar,
etc.

Ejemplo 4

Obtener una gráfica de tipo Chart para las mismas variables del ejemplo anterior. Primero
graficaremos sólo la variable Edad.

Solución

Al usar la secuencia <Graph> - <Bar Chart> obtenemos la siguiente ventana del lado izquierdo.
Luego de hacer clic en <Ok pasamos a la ventana que se muestra, donde completamos los datos
según se muestra en la derecha.

Qué ocurre si vuelve a graficar pero ahora hace clic en <Data View> y elige Project Line?

Podríamos decir que la mayor parte de los alumnos tienen entre 18 y 19 años.

Vuelva a usar la secuencia <Graph> - <Bar Chart>. De las opciones de <Bars represent> seleccione
<A function of a variable>. Haga clic en <Cluster> (segundo cuadro). Con ello logra obtener una
ventana como la que se muestra. Complete según se indica para graficar el crédito por edad.
Qué ocurre si en
lugar de usar la
opción Mean de
<Function>
selecciona
Count>?

Y si ahora
selecciona Sum o
alguna otra
función?

Por lo general, se
construye gráficos
de una variable en relación a otra. La variable determinante, es Y, y la variable X hace referencia a
la categoría de la distribución y en una relación lineal, constituye la variable independiente.

Ejercicio

Use la secuencia: <Graph> - <Bar Chart …> - <Cluster> - <Ok>. Como variables categóricas elija
Sexo y Edad. Haga clic en <Multiple graphs>. En <By variables with groups in separate panels>
ingrese Facultad. Luego <Ok> y <Ok>. Puede analizar los gráficos resultants?

Qué hubiera pasado si la variable Facultad se ingresa en “… on separate graphs?”.

Ejemplo 5:

1. Compare gráficamente la distribución de las horas dedicadas al estudio y a ver TV, en ventanas
diferentes.

2. Construya una gráfica que de las horas de estudio y horas de TV respecto a la edad.

Solución

1. Para la comparación gráfica pedida usaremos la siguiente secuencia:

<Graph> - <Bar Chart> - <Ok> En variables categóricas ingrese Hrs Est y Hrs TV. Luego haga
clic en <Ok>.

Los resultados se muestran en las siguientes figuras:


2. En este caso debemos ingresar información de las dos variables y usaremos como variable
categórica a la variable Edad.

Para ello usaremos la siguiente secuencia:

<Graph> - <Bar Chart> - <Ok>

Seleccione <Values from a Table>. En <Two-way table> seleccione Cluster.

Ingrese los datos según se muestra en la siguiente ventana.

En <Multiple Graphs…> seleccione <In separate panels of a same graph>. Luego <Ok>

Qué ocurre si se elige <On separate graphs>?

Qué ocurre si en <Multiple graphs> se activa la casilla <Same Y>.


Nota:
Compare las horas dedicadas a estudio(Hrs. Est) o TV (Hrs. TV) entre los varones y las
mujeres, que mostramos en las siguientes figuras.

Observe también que, usando el tipo de gráfico <Chart> podemos visualizar en una sola ventana
dos o más gráficos. En la tercera figura hemos superpuesto las Horas de TV (en color negro
sólido) a las Horas de estudio.

4. Información obtenida a partir de datos agrupados:

Si quisiéramos trabajar con un cuadro para la distribución de datos agrupados, y a partir de ella,
generar todos los estadísticos descriptivos que nos pueda proporcionar, el Minitab dispone de su
Lenguaje de Comandos que se ingresan en la Ventana de Sesión. Por ello a esta ventana se le
conoce también como la ventana de comandos.

De manera que el Minitab ofrece a sus usuarios dos modos de operación o de interfase:

La interfase de comandos y la interfase gráfica o GUI (el de ventanas)

Nota:

Por la dificultad que tiene el uso de la ventana Sesión o de Comandos y por el natural apego de todo
usuario de la computación al manejo de ventanas, esta sección la desarrollaremos en una página
avanzada .

Gráfico de Puntos (DotPlot)

Una gráfica de puntos permite representar a cada uno de los datos mediante un punto en el Eje X.
Si una determinada observación se repitiera, los puntos se visualizarán uno sobre otro; igualmente,
si hubiera observaciones muy próximas, los puntos se sobrepondrían uno sobre otro.

Veamos cómo se visualiza la gráfica de la variable Edad usando esta opción.

Ejemplo 6

Abra el archivo “Ingre99.Mtb” . Grafiquemos primero la variable Edad. Esto lo hacemos mediante:

<Graph> - <DotPlot> En Variables ingrese Edad. <Ok>


Comentario: Observamos que el mayor porcentaje de alumnos se concentra entre los 18 y 19 años,
con un sesgo, podríamos decir normal, hacia la derecha.

Plotee ahora la variable Créditos. La siguiente gráfica es el resultado del ploteo.

Se puede observar que un gran porcentaje de alumnos acumulan créditos que van desde 80 hasta
130. Y que, por otro lado, el conjunto de datos observados presenta dos grupos fuera de lo normal,
fuera de contexto, son los “outliers”. Si se eliminan estos datos incluyendo los que están alrededor
de 70, podríamos decir que los créditos acumulados se encuentran normalmente distribuidos.

Ejercicio

Compare gráficamente las horas dedicadas al estudio vs horas dedicadas a ver la televisión. Qué
conclusiones puede extraer. Quiénes tienden a ver más televisión?

Ejercicio

Comente la distribución de la variable Créditos por el Número de hermanos. La gráfica se muestra


en la siguiente figura.
5. Codificación de variables

Minitab ofrece codificar datos numéricos a numéricos, datos numéricos a texto, de texto a numéricos,
de texto a texto. Esto por que para efectos de graficar puede ser que para un tipo de gráfico
determinado, no permita hacerlo con variables de tipo texto o literales.

No siempre los datos son numéricos. Por ejemplo en el archivo Ingre99.mtw tenemos tres
variables que son de tipo carácter: Sexo, Colegio y Facultad.

Si bien el Minitab dispone de la opción <Tally> para obtener estadísticas en cuanto a frecuencia
absoluta y relativa de estas variables, sin embargo no se puede obtener un gráfico de ellas, excepto
de tipo <Chart>.

Pero si bien no podemos disponer de todos los tipos de gráficos, sí podemos codificar estos datos
como variables numéricas, como lo veremos en los siguientes ejemplos.
Ejemplo 7

Obtener una distribución gráfica de puntos (DotPlot) para las variables Facultad por Sexo.

Solución

Si Ud. intenta hacerlo, al usar <Graph> - <DotPlot> obtendrá una lista de variables en las que no
se encuentra ninguna de las de tipo literal. En este caso facultad no aparece.

Si pudiéramos construir otra columna que contenga un 1 por cada alumno de Agraria, un 2 por
cada alumno de Biología, 3 por cada alumno de Biotecnia y 4 por los alumnos de Medicina,
podríamos disponer de esta nueva columna, de tal forma que al usar <Graph> -
<DotPlot> ingresamos Créditos en <Variables> y en <By variables>, ingresamos la nueva
columna.

Para construir la nueva columna numérica, a partir de la columna Facultad, de tipo texto, use

<Data> - <Code> - <Text to Numeric…>

La ventana que aparece es la que


se muestra en la siguiente figura.
Complete los datos según se
indica y grafique.

En <Code data form column>


ingresamos Facultad

En <Into columns> ingresamos la


nueva columna que contendrá los
códigos, C11

En <Original values> ingresamos Agraria

En <New> ingresamos 1.

En la siguiente línea hacemos lo mismo ingresando Biología y 1 respectivamente.

Procedemos de manera similar para Biotecnia, 3 y para Medicina, 4.

Ingrese FacultadNumerico como nombre de la columna C11.


Con esta modificación nuestra variable Facultad será FacultadNumerico y estará en la columna
C11.

Ahora podemos usar cualquier tipo de gráfico con esta variable.

En particular, para DotPlot, tendremos

<Graph> - <DotPlot>

En Y ingresamos Créditos

En X ingresamos C11 o FacultadNumerico

La gráfica se ve en la siguiente figura

6. Gráfico circular (PIE CHART)


Este es uno de los tipos de gráficos más conocido junto con los de barra o de línea. El Minitab
dispone de gráficos circulares de dos y tres dimensiones.

Vamos a construir gráficos circulares tipo torta. Para ello usaremos el archivo Ingre99.

Qué porcentaje de varones y mujeres conforman esta sección de alumnos?

Como la columna C2 contiene la variable Sexo, usamos la secuencia:

<Graph> - <Pie Chart>. En la ventana


siguiente ingrese la variable Sexo. Haga clic en
<Labels>. Vaya a la ficha <Slice labels>. Active
todas las opciones de esta ficha.

Finalmente haga clic en <Ok>

Ejemplo 8

Construya un gráfico de tipo torta para la variable Facultad.

Solución

El siguiente es el gráfico que Ud. debe obtener. La variable es Facultad.


La secuencia es la siguiente:

<Calc> - <Pie Chart>

Para verificar si los porcentajes son los indicados podemos usar <Tally>.

Para ello usamos la secuencia: <Stat> - <Tables> - <Tally> - <Variables> C11 . Active todas las
opciones. Compare estos porcentajes con los del gráfico.

Ejemplo 9

Construya otro gráfico circular que represente


los porcentajes de los datos en cada
intervalo.

El resultado debe ser el que se muestra en el


siguiente gráfico.

En este caso use la opción <Chart table>.

En <Categories in> ingrese C4.

En <Frequencies in> ingrese C8.


Nota:
Observe esta otra forma de graficar la misma variable usando la opción <Pie Chart ...>. En
este caso hemos hecho clic con el botón derecho sobre el gráfico; se ha seleccionado <Edit
Pie> y luego hemos ido a la ficha <Explode> y hemos hecho clic en la casilla.

A continuación haremos uso del Minitab para obtener las medidas de tendencia central, de
dispersión y las de posición que forman parte de la estadística descriptiva.

7. Los gráficos y la Estadística Descriptiva


Ante todo revisemos algunas formas de obtener medidas de tendencia central o de dispersión.

Entre las medidas de tendencia central tenemos:


La media aritmética

La mediana Es el valor central de un conjunto de datos

La moda Es el valor de mayor frecuencia de repetición

La media podada Es la media aplicada luego de eliminar extremos de datos que


distorsionan al conjunto. En términos de notas de 30
alumnos, donde 4 no rindieron la prueba y 5 obtuvieron 20,
mientras que los 21 restantes se encuentran alrededor del
promedio 12, diríamos que la media es afectada por los que
no rindieron la prueba.

Entre las medidas de dispersión, que miden la variabilidad, tenemos:

La varianza

La desviación estándar

El coeficiente de variación ; mide el porcentaje de variabilidad de los datos.

Respecto a las medidas de posición, podríamos añadir las siguientes:

Cuartiles.

Dividen a los datos en cuatro grupos porcentualmente del mismo tamaño. El primer cuartil, Q 1,
indica que el 25% de los datos tienen valores como máximo a Q 1. El segundo cuartil, Q2
representa el 50% de los datos inferiores o iguales a él. Y Q 3 representa a los 75% de valores
menores o guales a dicho valor.

Deciles: Equivalente a los cuartiles, pero que divide a los datos en 10 grupos iguales.

Usemos el minitab
Además de las estadísticas por fila y columna que nos proporciona el comando <Calc>,
disponemos del comando <Stat> que en su primera opción tiene a <Basic Statistics> para
proporcionarnos las estadísticas antes mencionadas, visualizándolas en la ventana de sesión, o
almacenando en la hoja de trabajo activa.

Con solo apreciar la figura anterior, podemos deducir que el Minitab constituye una buena
herramienta de apoyo tanto en el estudio de la Estadística como en el campo de la investigación.

Las opciones del comando <Stat> se agrupan por categorías:

<Display Descriptive Statistics...>: Aquellas que proporcionan resultados descriptivos propios de


una muestra;

<Store Descriptive Statistics...>: Los que permiten guardar los resultados en columnas

Las opciones

<1- Sample Z ...> , <1 – Sample t >, <2 – Sample t> y <Paired t …> :

nos permiten realizar procesos de estimación y prueba de hipótesis para una o dos poblaciones, o
realizar análisis de datos pareados.

Las opciones

<1 proportions ...> , <2 – proportions ...>

nos proporcionan estimaciones a partir de las proporciones muestrales, sobre una o dos
poblaciones.

<2 Variances ...>:

nos permite analizar la razón de variabilidad en el comportamiento de dos poblaciones, a través de


sus varianzas.

Las opciones

<Correlation ...> y <Covariance ...>:


nos proporciona información suficiente para un análisis de regresión y correlación de los datos.

<Normality test>: Que permite realizar una prueba de hipótesis para examinar si los datos se
ajustan a una distribución normal, proporcionando además una gráfica de tipo Plot.

A continuación resolveremos algunos ejemplos usando estas herramientas y las otras serán
tomadas en cuenta dentro del tema que les corresponde

Ejemplo 10

Realice un análisis descriptivo respecto a la variable Promedio General de los alumnos en el


archivo Ingre99.mtw.

Solución

Abra el archivo de datos INGRE99.MTW.

Usemos la secuencia:

<Stat> - <Basic Statistics> - <Display Descriptive Statistics>

En <Variables> ingresemos “Prom. Gral”; es decir, la columna C6.

He aquí los resultados:

Results for: Ingre99.MTW

Descriptive Statistics: Prom.Gral.

Variable Mean StDev Minimum Q1 Median Q3 Maximum

Prom.Gral. 11.071 0.486 10.150 10.740 11.070 11.550 11.860

Donde

N Representa el total de observaciones(total de alumnos)

Mean Representa la media aritmética, media o promedio muestral

Median Es la mediana de los datos

TrMean Representa la media podada. Hay datos extremos? Lo veremos después.

StDev Desviación estándar de la muestra.

SE Mean Es la desviación estándar poblacional(también error estándar de la media)

Minimum Es el mínimo valor de la muestra u observación

Maximum Es el máximo valor de los datos


Q1 Representa el primer cuartil

Q3 Representa el tercer cuartil

Interpretación:

Los 120 alumnos tienen como Promedio General de grupo a 11.071; con una desviación estándar
de 0.486; centrados en 11.070, que es la Mediana

El promedio mínimo es 10.15 y el máximo es 11.86.

En base a estos dos últimos estadísticos de posición podríamos obtener:

Rango Intercuartílico(RIQ) : La diferencia entre Q3 y Q1; es decir IRQ = Q3 – Q1

Fronteras interiores : Usado en los Diagramas de Caja(BoxPlot)

Izquierdo: Q1 - 1.5 RIQ

Derecho : Q3 + 1.5 RIQ

Fronteras exteriores : Usado en los Diagramas de Caja(BoxPlot)

Izquierdo: Q1 - 3 RIQ

Derecho : Q3 + 3 RIQ

En los resultados podemos apreciar que Q1 = 10.74; esto significa que el 25% de los alumnos
tienen un promedio máximo de 10.74. Como la mediana es 11.07, entonces el 50% de los
promedios no sobrepasan 11.07.

Del mismo modo, Q3 = 11.55 indica que el 75% de los promedios de los alumnos están por debajo
de 11.55; dicho de otra manera, el 25% de los alumnos tienen un promedio superior a 11.55.

Nota:
Si un dato observado se aparta más allá de las fronteras exteriores, se dice que el dato es un
“outlier” extremo y se representa por “0”; en caso contrario se dice que presenta un “outlier”
moderado, en cuyo caso se representa por “*”.

Ejemplo 11

Ahora obtendremos estadísticas del promedio general por a) sexo y b) por Colegio de
procedencia. Además pediremos que nos muestre el histograma de los datos así como un
resumen gráfico (Graphical summary).

Solución

Usando la secuencia:
<Stat> - <Basic statisic> - <Display descriptive statistics ...>

En la ventana cuyo titulo es Display Descriptive statistics , en el recuadro <Variables>


ingresamos la variable Prom. Gral.

Activamos la opción <By variables> e ingresamos la variable Sexo en el recuadro.

Hacemos clic en el botón<Graphics> y dentro de esta nueva ventana activamos <Graphical


summary>.

Los resultados fueron:

a) Por sexo

Descriptive Statistics: Prom.Gral.

Total

Variable Sexo Count Mean SE Mean StDev Variance CoefVar Minimum

Prom.Gral. F 80 11.135 0.0534 0.478 0.228 4.29 10.200

M 40 10.942 0.0764 0.483 0.234 4.42 10.150

Variable Sexo Q1 Median Q3 Maximum IQR

Prom.Gral. F 10.800 11.230 11.550 11.640 0.750

M 10.390 11.050 11.170 11.860 0.780

En cuanto a la gráfica pedida, en la siguiente figura solo mostramos las ventanas de gráfico
correspondiente a la variable Sexo = “M”. La ventana de la izquierda contiene el histograma. El
promedio de los varones tienen mayor variación (CV(X) = 16.424).

En ella se puede apreciar que el promedio general de los varones está alrededor de 12. Presenta
un sesgo hacia la izquierda; es decir, es asimétrica hacia la izquierda. En cuanto a la segunda
ventana podemos encontramos una descripción gráfica así como una cuantitativa del promedio
general de los varones. Hay estadísticos como Skewness, Kurtosis, intervalos de confianza, P
value, que nos los analizaremos por ahora.
En la siguiente sección comentaremos gráficos de caja, que se muestra horizontal y en azul, por
debajo del histograma.

b) Por Colegio de procedencia

He aquí los resultados emitidos en la Ventana de Sesión:

Descriptive Statistics: Prom.Gral.

Total

Variable Colegio Count Mean SE Mean StDev Variance CoefVar Minimum

Prom.Gral. Priv 67 11.093 0.0585 0.479 0.229 4.31 10.200

Públ 53 11.043 0.0685 0.499 0.249 4.52 10.150

Prom.Gral. Priv 10.800 11.070 11.600 11.860 0.800

Variable Colegio Q1 Median Q3 Maximum IQR

Prom.Gral. Priv 10.800 11.070 11.600 11.860 0.800

Públ 10.445 11.150 11.550 11.640 1.105


8. Diagrama de cajas (BOXPLOT)
El BoxPlot es un instrumento gráfico en la estadística descriptiva que permite realizar un análisis
más detallado y conciso respecto a la distribución de los datos en la muestra. Esto se
complementa, de manera cualitativa, con los resultados cuantitativos obtenidos a través de los
estadísticos de la muestra. Adicionalmente un Diagrama de Cajas permite determinar si la muestra
tiene elementos “outliers” y si presenta un sesgo a la izquierda a la derecha o izquierda.

La siguiente figura describe los elementos que conforman una caja en un gráfico BoxPlot. La
forma de visualizar la caja depende de cómo se pide la gráfica.

Los outliers son valores extremos en el conjunto de los datos.

Le media podada resulta del cálculo de la media aritmética, luego de eliminar estos outliers.

Si la mediana se encuentra muy cerca de la cara lateral derecha (superior en este caso) es por
que se acerca al tercer cuartil Q3, en cuyo caso se dice que los datos presentan una asimetría
hacia la izquierda.
Ejemplo 12

Construyamos un diagrama de cajas (BoxPlot) para la variable créditos aprobados

Solución:

Usemos la siguiente secuencia:

<Stat> - <Basic Statistics> - <Display descriptive stastistic >

En el recuadro <Variables> ingresamos la variable Créditos.

La gráfica anterior corresponde a la solución de este ejemplo.

En ella podemos observar que:


La mediana es 113

El valor de los cuartiles son: Q1 = 95, Q3 = 119

Haciendo uso de las fórmulas para las fronteras dadas anteriormente, encontramos:

Fronteras interiores 59 y 155

Fronteras exteriores 23 y 191

Los datos presentan dos outliers: 13 y 15. Ambos son extremos

Ejemplo 13

Obtenga un diagrama de cajas para la variable Créditos por la variable Sexo.

Solución

Ante todo usaremos el comando <Stat> - <Basic statistics> - <Ddisplay descriptive ...>

Obtuvimos los siguientes resultados:

Descriptive Statistics: Creditos by Sexo

Variable Sexo N N* Mean Median TrMean

Créditos F 68 12 106.88 113.00 110.21

M 37 3 81.35 94.00 83.00

Variable Sexo StDev SE Mean Min. Max. Q1 Q3

Créditos F 24.03 2.91 15.00 130.00 98.00 120.00

M 45.04 7.40 13.00 125.00 13.00 118.00


En esta figura hemos indicado los elementos del Diagrama de Cajas para el Sexo Femenino.

Como se puede apreciar, los créditos de las alumnas presentan una cierta inclinación hacia el
tercer cuartil; es decir, un gran porcentaje de alumnos tienen promedio por encima de la mediana

Ejemplo 16 (Usando la versión 13 de Minitab)

También podemos obtener gráficos de caja usando el modo texto del Minitab. Para ello usamos la
secuencia de comandos:

<Graph> - <Carácter graphs> - <BoxPlot>

En el recuadro de variables ingresemos la variable “Crédito”


He aquí el gráfico. Hay sesgo por la izquierda.

-----------

OO ------------I + I----

-----------

+---------+---------+---------+---------+---------+------Créditos

0 25 50 75 100 125

Nota:
- Observe los dos “outliers” que ya habíamos observado antes. Y son extremos.
- Observe ahora una gráfica BoxPlot para la variable Prom. Gral por el tipo de
Movilidad.

La gráfica siguiente nos indica que no tienen “outliers” y la asimetría es muy leve en el caso de los
que no tienen movilidad.

A continuación mostramos también los resultados obtenidos al usar esta opción de Graph, pero en
la modalidad de caracteres <Character graph>.
Movilidad

--------------------------

0 -------------I + I--------

--------------------------

---------------

1 ----------------I + I--------------

---------------

--------+---------+---------+---------+---------+--------Prom.Gral

9.0 10.5 12.0 13.5 15.0

9. Graficos agrupados

Ejemplo 17

Construya una gráfica de barras agrupadas para comparar el total de alumnos por facultad,
provenientes de los colegios públicos y privados.

Use la siguiente secuencia: <Graph> - <Bar Chart>

Seleccione la opción <Cluster> y luego clic en <Ok>. En <Variables categóricas> introduzca las
variables Colegio y Facultad.

Hagamos que las barras se muestren de colores diferentes: Para ello, use botón derecho sobre
una de las barras. Clic en <Edit bars>. Haga clic en Custom de <Fill pattern> y seleccione el color
Lima en <background color>. En la ficha Groups, ingrese la variable Colegio en el recuadro.
Luego haga clic en <Ok>. Obtendrá el siguiente gráfico.
Ahora use la opción <Stack> e ingrese las dos variables. Obtendrá el gráfico de la derecha.

Pedimos a Ud. que obtenga la segunda gráfica que representa una gráfica de barras agrupadas
de tipo <Stack>, una sobre otra. Tomando en cuenta para ello la variable Sexo.

10. Gráfico de múltiples variables

En Minitab podemos trazar la gráfica de varias variables en la misma ventana de gráficos. Esto
permite un análisis del comportamiento de las mismas a través del tiempo. Podemos ubicar en el
Eje X la variable que permite la generación de los eventos en las otras variables y visualizar su
recorrido por cada cambio de X.

Ejemplo 28

Abra el archivo DemProd.Mtw que se encuentra en la carpeta de trabajo. Este archivo contiene la
demanda de tres tipos de productos: A, B y C de la empresa “Producciones Magic S.A.” durante
los meses del año 2001.

Construya un gráfico de líneas conectadas de la demanda de los tres productos.


Solución

Una vez abierto el archivo Ud. verá que la primera columna contiene los meses del año 2001.
Usaremos esta columna para graficar las otras tres columnas.

La secuencia es:

<Graph> - <ScatterPlot> - <With connect line> - <Ok>.

Una parte de la siguiente ventana, se aprecia aquí.

Complete la siguiente ventana como se muestra en la figura.

Como puede apreciar, hemos ingresado la columna de los meses en el Eje X y la demanda de los
tres productos, en el Eje Y.

Observe que la variable Mes se ha repetido para las tres variables de producto.

En <Data display> de <Data view> seleccione Connect line.

En <Multiple graph> seleccione <Overlaid on the same graph>. Luego <Ok> y <Ok>.
11. Introducción a Regresión

Hagamos una introducción a las ecuaciones de regresión, que más tarde las trataremos dentro del
concepto de Intervalos Confianza y Pruebas de Hipótesis.

Abra el archivo Regre01.Mtw que se encuentra en su carpeta de trabajo. Este archivo contiene la
información del Producto Bruto Interno (PBI), el Gasto Público (GP) y las Exportaciones (EX) de un
determinado país entre los años 1984 – 1996. Respecto a estos datos queremos encontrar la
relación entre el PBI y el GP.

Si existe una relación, esta debe ser de la forma

YPBI =  +  GPT + T

donde  es una variable de perturbación que cumple determinadas condiciones ideales

 es el coeficiente de regresión; parámetro a ser estimado

 es el intercepto, parámetro a ser estimado


YPBI es el valor del PBI a ser estimado

Las ecuaciones de estimación de estos parámetros se muestran a continuación

para los cuales

Coeficiente de correlación  :

Es un estadístico que representa el grado de asociación entre las variables

El valor de  se obtiene mediante la fórmula

Ejemplo 29

Ante todo plotearemos las variables PBI y GP para ver si efectivamente existe una relación
lineal PBI = f(GP) entre ellas. Esto lo haremos usando la siguiente secuencia:

<Graph> - <ScatterPlot>. Seleccione <Wth groups> - <Ok>. Como variable X elegimos a GP y


como Y elegimos a PBI. La gráfica se muestra en la siguiente figura.

La gráfica nos indica que efectivamente existe una relación entre las variables. Pero qué tan bien
queda explicada, PBI por GP; si se incrementa una unidad de GP, en cuánto se incrementa el
PBI? Qué grado de correlación existe entre ellas?
Necesitamos pues obtener mayor información. Esto nos lo permite el uso de la regresión lineal.

Usando los datos del archivo Regre01.Mtw, obtendremos los estimadores de la ecuación YPBI = 
+  GPT + T

Para ello usemos la siguiente secuencia:

<Stat> - <Regression> - <Regression>

En la siguiente ventana ingresar a la variable GP como variable predictora(Predictor) y a PBI como


la variable explicativa(Response).

Ingresando por la opción <Results> pedimos Ecuación de regresión, coeficientes, r,...

Ingresando por la opción <Graph> pedimos ploteo de Residuales vs lo estimado.

Igualmente podemos almacenar una serie de resultados como los valores de los coeficientes, la
tabla de los residuales, etc.

Los resultados se dan a continuación; también mostramos la gráfica de los residuales vs el PBI
ajustados.

Regression Analysis

The regression equation is

PBI = - 439 + 13.3 GP

Predictor Coef StDev T P

Constant -439.2 221.0 -1.99 0.072


GP 13.2908 0.9434 14.09 0.000

S = 139.9 R-Sq = 94.7% R-Sq(adj) = 94.3%

Como parte de las opciones pedidas también tenemos el análisis de varianza:

Analysis of Variance

Source DF SS MS F P

Regression 1 3887134 3887134 198.48 0.000

Residual Error 11 215426 19584

Total 12 4102560

También podemos graficar la recta de ajuste sobre el diagrama de dispersión, usando <Stat> -
<Regression> - <Fitted Line Plot>.

Seleccionar las mismas variables X e Y. El gráfico se muestra a continuación


Igualmente podemos almacenar los resultados del cálculo regresional para luego graficar los
residuales y los valores estimados. Para ello usamos la secuencia:

<Stat> - <Regression> - <Regression> .

En la opción <Storage> activamos entre otras: Coeficientes, Fitts, residual, X matriz.

Con estos resultados, y suponiendo que los ajustes y residuales se encuentran en la columna
C6(fitts1) y C7(resid1), hacemos uso de la siguiente secuencia:

<Stat> - <Regression> - <Residual Plots> Las variables son las mismas.

Los resultados se muestran a continuación.


12. Ejercicios propuestos

La solución a Ej01 y Ej02 están en el archivo Proy03.mpj

EJ01. La siguiente tabla representa el monto de los ingresos salariales de la población


económicamente activa y el monto de los ahorros en el sistema bancario de un país entre los años
1950 a 1996

Construya una gráfica que muestre el comportamiento de ambas variables

Año Ingreso Ahorro


1950 2 200,000 57,120
1960 2 345,000 172,077
1970 271,000 478,340
1980 3 182,328 1 129,312
1990 3 522,037 1 582,061
1996 3 782,862 2 168,697

EJ02. La siguiente tabla muestra el porcentaje de familias con diversos niveles de ahorros durante
los años 1969 y 1994

Año 1969 Año 1994


Menos de 10,000 7.9 8.7
10,000 - 14,999 6.7 6.9
15,000 - 24,999 15.8 15.0
25,000 - 34,999 19.1 14.3
35,000 - 49,999 24.7 18.0
50,000 - 74,999 17.8 19.9
75,000 - 99,999 5.0 8.8
Más de 100,000 2.9 8.4

a) Construya una gráfica de histograma para comparar la variación de los ingresos

b) Construir un gráfico de torta para ver la distribución de las personas por nivel de ingreso en
los dos años.

EJ03. Los siguientes datos representan los tiempos de sobrevivencia(en dias) de 50 pacientes
aquejados de cáncer: 42 45 51 46 340 81 243 63 155 151 37 138 245
377 537 455 776 163 20 1234 201 2970 456 1235 1581 40 3808 1804 719 365 129 45
9 234 1092 827 272 188 54 93 128 822 282 532 102 152 182
2827 2672 28 53 912.

Con respecto a estos datos:

a) Construya un cuadro de distribución de frecuencias

b) Calcular los estadísticos media, mediana, desviación estándar, máximo, mínimo

c) Construir el histograma de los datos. Comentar

d) Construir un gráfico de tipo BoxPlot. Comentar

EJ04. La siguiente tabla muestra la distribución de frecuencia de los tiempos (en minutos) que
tiene que perder un conductor para desplazarse desde El Jockey Plaza Shopping Center hasta La
Avenida Arequipa.

Intervalo de clases Frec. Abs. Frec. Rel. Frec. Abs. Ac. Frec. Rel. Ac.
10.0 - 14.9 3
15.0 - 18.9 10
19.0 - 22.9 14
23.0 - 26.9 25
27.0 - 30.9 17
31.0 - 34.9 9
35.0 - 38.9 2
a) Obtenga la amplitud de clase

b) Obtenga la marca de clase

c) Obtenga el tamaño de la muestra

d) Complete la tabla

e) Construya histograma de frecuencia

Nota: La solución al ejercicio 5 se debe usar para resolver el ejercicio 3 y 4

Observación

El siguiente ejercicio es particularmente importante ya que nos permite obtener la tabla de


distribución de frecuencia para un conjunto de datos, utilizando los recursos que nos proporciona
la gráfica de histograma que en este caso recibe el nombre de Histograma de frecuencias.

EJ05. Construya una tabla de distribución de frecuencias a partir del gráfico de histograma y
determinando el número de intervalos mediante el criterio de Sturges (k = 1 + 3.323Log(n) ).

Solución

Procedimiento:

P1. Abrir el archivo Saldos.mtw.

P2. Obtenr las estadísticas: Máximo, Mínimo, Rango, N total usando: <Stat> - <Basic Statistics> -
<Display descriptives statistics>. Ingresar la variables Saldo (C1) - <Statistics> - Activar Mean,
Maximum, Minimum, Range y N total - <Ok> - <Ok>

n = 2074 Max = 3578 Min = 32 Rango = 3546

P3. Calcular el número de intervalos: k = 1 + 3.323*Log(n) = 1 + 3.323*Log(2074). Según esto k =


12. Esto es, la tabla a ser construida tendrá 12 intervalos. Ahora se debe calcular la amplitud o
ancho de cada intervalo (en nuestro caso, todos los intervalos tendrán el mismo ancho). C =
Rango / k = 3546 / 12 = 295.5

P3. Construir el histograma usando: <Graph> - <Histogram> - <Simple> - <Ok> - En <Graph


variable> ingresar Saldo o C1. Luego <Ok>. Esto nos construye el histograma no importa el
número de intervalos. Esto se debe ajustar a 12.

Paso 4: En el gráfico, botón derecho sobre el eje de categorías (Eje X). Hacer clic en <Edit X
scale>. En la ficha <Binning>, activar: <CutPoint> y <Midpoint cutpoint positions>. Al interior del
recuadro digitar: Min:Max/Amplitud. En nuestro caso: 32:3578/295.5. - <Ok>.
Nota:

Esto permite reconstruir el histograma con el número de intervalos requerido. Si C tuviera muchos
decimales, trate de redondear por exceso a fin de que logre obtener los intervalos deseados.
Cuando esto ocurra se tendrá expresado el Mínimo y Máximo así como cada uno de los extremos
de los 12 intervalos. Si ocurre como en este ejemplo, el extremo del intervalo que falta es
suficiente sumar C al extremo inferior.

Paso 5: Colocar la frecuencia absoluta como etiqueta de cada barra: Este es el único y principal
motivo por el que se recurre al gráfico. Haga clic con el botón derecho sobre cualquiera de las
barras del gráfico; seleccione <Add> y luego <Data labels>. Luego <Ok> sin modificar nada en la
ventana. Copie en su tabla en la columna fi.

Paso 6. Obtener la frecuencia absoluta acumulada: Fi. Haga clic con el botón derecho sobre el eje
vertical; hacemos clic en <Edit Y scale>. En la ficha <Type>, activar la casilla Acumulative values
cross bins; <Ok>.

Paso 7. Obtener la frecuencia relativa: Botón derecho sobre el Eje vertical; en Type seleccionar
<Percent> - <Ok>. Desactivar <Acumulative …>

Paso 8: Obtener la frecuencia relativa acumulada. Repetir el paso 7 pero ahora activar
<Acumulative ….> - <Ok>.

Paso 9. Obtener la marca de clase o punto medio: El punto medio es la semisuma de los límites
inferior y superior de cada intervalo.

La tabla de frecuencia a obtenerse debe ser el siguiente:

No de Int. Lim. Inf. Lim. Sup. Pto. Medio Fi Fi hi Hi


1 32 327.5 179.75 87 87 0.04194793 0.04194793
2 327.5 623 475.25 99 186 0.04773385 0.08968177
3 623 918.5 770.75 100 286 0.04821601 0.13789778
4 918.5 1214 1066.25 239 525 0.11523626 0.25313404
5 1214 1509.5 1361.75 303 828 0.1460945 0.39922854
6 1509.5 1805 1657.25 283 1111 0.1364513 0.53567985
7 1805 2100.5 1952.75 288 1399 0.1388621 0.67454195
8 2100.5 2396 2248.25 253 1652 0.12246866 0.79701061
9 2396 2691.5 2543.75 118 1770 0.05641273 0.85342334
10 2691.5 2987 2839.25 101 1871 0.04918033 0.90260366
11 2987 3282.5 3134.75 90 1961 0.04291225 0.94551591
12 3282.5 3578 3430.25 113 2074 0.05448409 1
Y el histograma mostrando las frecuencias absolutas es el siguiente:

Como se puede observar, la función que realizan estas opciones son similares a las que
se encuentran en las ventanas del comando <Edit> o <Edición> de muchas aplicaciones,
sólo que en el caso del Minitab, todas ellas se aplican sobre un conjunto de celdas(filas
o columnas seleccionadas) de la hoja de trabajo.

Nota:
Dejamos para un desarrollo posterior la opción <Link> que permite realizar enlaces
entre una y otra columna bajo la concepción DDE(Dynamic Data Exchange)

Potrebbero piacerti anche