Sei sulla pagina 1di 11

PROCESOS ESTADISTICOS CON EXCEL

Guía 1: ALMACENAMIENTO Y MANIPULACIÓN DE DATOS. TABLAS DE


FRECUENCIA Y GRÁFICOS.

Autor: Lic. Jairo Alberto Mora Fernández

1. Introducción. La presente guía ilustra los procesos de creación de


bases de datos estadísticos con el fin de ser manipulados, clasificados, tabulados,
y su frecuencia representada gráficamente, utilizando la versión de EXCEL 2007.

2. Creando una base de datos. Al disponer de una base de datos se


asume que cada variable de estudio tiene un nombre bien definido. Por
simplicidad, se recomienda codificar los nombres de variable colocando solo un
nombre representativo de la misma, o las iniciales del nombre. Igual, los datos de
tipo cualitativo se codifican asignando a cada resultado un número que pueda
tener relación con el, o las iniciales del nombre.

La siguiente Tabla No. 1 hace referencia a aspectos de calificación y clasificación


financiera de un grupo de 29 empresas fabricantes de componentes de partes de
computadores. Las variables hacen referencia a la Casa de Bolsa donde se
comercializan las acciones (NYSE es la bolsa de New York, AMEX es la American
Stock Exchange, y OTC es transacción en ventanilla), al Nivel de rendimiento de
las acciones (1 es el rendimiento mas bajo y 5 el mas alto), al Precio por acción
(PPA), al Porcentaje de Propiedad (%PROP) y a la Relación Precio / Valor en
libros (RPV). Estos nombres codificados serán los encabezados de las columnas
en la Base de Datos de Excel.

Tabla No. 1

BOLSA NIVEL PPA % PROP RPV


OTC 1 12,31 45,4 2,49
OTC 2 11 66,1 2,22
OTC 5 65,5 83 6,84
AMEX 3 35,95 91,5 4,25
AMEX 2 15 33,4 2,04
OTC 1 43 58,8 1,92
NYSE 3 14,25 11,8 3,47
NYSE 3 16,25 20,9 2,38
OTC 3 12,88 30,8 1,41
OTC 4 39,13 36 6,45
AMEX 5 61,5 50,2 4,35
OTC 3 28,75 14,4 4,53
OTC 3 30,5 26,5 8,07
OTC 4 27,19 76,6 2,16
AMEX 4 16,31 18,2 4,48
AMEX 3 11,88 39,8 3,34
NYSE 4 33 56,9 3,29
OTC 3 28,19 57 2,65
OTC 3 27,44 63 3,01
AMEX 3 15,13 41,9 2,46
NYSE 5 55,5 77,2 2,48
OTC 4 48 53,9 7,5
NYSE 4 34,25 61,3 3,61
AMEX 4 38,94 82,3 3,8
AMEX 3 11,31 34,8 16,34
OTC 2 43,15 59,3 6,12
OTC 1 52,17 45,4 7,25
OTC 3 21,12 51,6 9,38
NYSE 4 42,7 62,7 11,43

2. Manipulando la base de datos. Los datos de la base anterior puede ser


reclasificada en función los valores o estados de las variables (referimos a valores
cuando la variable es cuantitativa, y a estados cuando es cualitativa). Esto se
consigue con las opciones Inicio, y Ordenar y filtrar. Esta opción permite
ordenar datos en forma alfabética o personalizada, y hacer filtrado de datos. Para
hacer filtrado, ubíquese en la celda correspondiente al primer encabezado, a la
izquierda, sobre el título Bolsa, y active la secuencia Inicio>Ordenar y
filtrar>Filtrar. También la secuencia Datos>Filtro permite acceder en forma
directa. Aparecerán pequeños cuadrados con flecha al lado derecho de cada
nombre de variable. Si hacemos click sobre uno ellos, por ejemplo la variable
Bolsa, aparece la lista de opciones de esta variable, todas seleccionadas
indicando que están activas en la lista. Si dejamos seleccionada solo la opción
OTC y deseleccionamos las demás opciones, la base de datos se reduce a solo
aquellos que corresponden a este estado de variable:

Tabla No. 2

BOLSA NIVEL PPA % PROP RPV


OTC 1 12,31 45,4 2,49
OTC 2 11 66,1 2,22
OTC 5 65,5 83 6,84
OTC 1 43 58,8 1,92
OTC 3 12,88 30,8 1,41
OTC 4 39,13 36 6,45
OTC 3 28,75 14,4 4,53
OTC 3 30,5 26,5 8,07
OTC 4 27,19 76,6 2,16
OTC 3 28,19 57 2,65
OTC 3 27,44 63 3,01
OTC 4 48 53,9 7,5
OTC 2 43,15 59,3 6,12
OTC 1 52,17 45,4 7,25
OTC 3 21,12 51,6 9,38

Si repetimos el proceso sobre la variable PPA y seleccionamos Filtros de número


y seleccionamos la opción es mayor o igual que 50, se obtiene

Tabla No. 3

BOLSA NIVEL PPA % PROP RPV


OTC 5 65,5 83 6,84
OTC 1 52,17 45,4 7,25

Estos datos corresponden los valores de bolsa OTC que presentan un valor PPA
mayor o igual que 50.

Para restituir la tabla original, se actúa sobre las variables manipuladas y se


selecciona (Seleccionar todas), o simplemente se desactiva Autofiltro.

A continuación, ejercite con la opción Inicio>Ordenar y filtrar>Filtrar con otras


variables de la base de datos.

3. Elaborando tablas de frecuencia con datos cualitativos. En la Tabla No.


1, las variables Bolsa y Nivel son categóricas (cualitativas), por lo que el siguiente
procedimiento es apropiado. Desarrollaremos el proceso con la variable Bolsa, y
dejamos el proceso con la otra variable para el lector. Proceda como sigue:

- Elija en la barra de menú la opción Insertar y luego Tabla dinámica, y de


nuevo Tabla dinámica.

- En el cuadro de dialogo Crear tabla dinámica se introduce el rango de


datos. Por defecto la tabla activa toda la base de datos. Se aplica Aceptar,
y aparece un cuadro con varias ventanas: Lista de variables (Bolsa, Nivel,
PPA, …), Filtro de informe, Rótulos de columna, Rótulos de fila,
Valores.

- Se arrastra entonces la variable Bolsa de la lista de variables hasta la


ventana Rótulos de fila, y luego se arrastra de nuevo la variable Bolsa
hasta la ventana Valores.

- Hecho esto, aparece la siguiente tabla:

Cuenta de
Rótulos de fila BOLSA
AMEX 8
NYSE 6
OTC 15
Total general 29

Como se ve, la tabla obtenida es, de hecho, una Tabla de Distribución de


Frecuencia Absoluta de tipo discreto, donde debajo del nombre de Rótulos de
fila aparecen los estados de la variable (AMEX, NYSE y OTC) y debajo de Cuenta
de Bolsa aparece el conteo (Frecuencia Absoluta) de los datos correspondientes
a cada estado de variable. El nombre Cuenta de Bolsa encima de la tabla hace
referencia al conteo de la frecuencia, y debe verificarse que esté ese y no otro
nombre, pues pueden aparecer nombres como Suma, Promedio, Max, Min, ...,
entro otros. En tal caso, haga doble clic sobre Cuenta de Bolsa y aparecen las
opciones correspondientes. Selecciones la opción adecuada, y aplique Aceptar. .

Los resultados de esta tabla pueden ser presentados en forma de porcentaje con
la siguiente rutina:

- Haga doble click sobre Cuenta de Bolsa de la tabla anterior. Entonces


aparece un cuadro de diálogo. En el se selecciona Mostrar datos como:
se selecciona % de columna y luego Aceptar.

- Aparece entonces la columna Total de la tabla anterior reemplazada por


valores en porcentaje.

Cuenta de
Rótulos de fila BOLSA
AMEX 27,59%
NYSE 20,69%
OTC 51,72%
Total general 100,00%

- Para regresar a la presentación con valores absolutos, se repite el proceso


anterior, y en Mostrar datos como: se selecciona Normal. Al Aceptar, se
restaura la presentación anterior de la tabla.

Si se desea hacer una tabla de doble entrada (Tabla de contingencia) con las
variables Bolsa y Nivel, se aplica el proceso de Tabla dinámica, y de la lista de
variables se arrastra la variable Bolsa a la ventana Rótulos de fila, la variable
Nivel de arrastra a la ventana Rótulos de columna, y cualquiera de estas dos
variables se arrastran a la ventana Valores. Aparece entonces una tabla como la
siguiente:
Cuenta de
BOLSA Rótulos de columna
Rótulos de fila 1 2 3 4 5 Total general
AMEX 1 4 2 1 8
NYSE 2 3 1 6
OTC 3 2 6 3 1 15
1
Total general 3 3 2 8 3 29
En esta tabla, los valores centrales corresponden a las frecuencias cruzadas de
las combinaciones de las opciones de las dos variables.

4. Elaborando Tablas de Frecuencia con Intervalos de Clase. El siguiente


procedimiento es adecuado para datos cuantitativos con la característica de que
cada valor de variable se repite pocas veces. Este es el caso para las variables
PPA, %PROP y RPV, de la base de datos que hemos creado.

En tal caso, es necesario construir previamente los Intervalos de Clase


correspondientes a la variable en estudio, siguiendo el procedimiento establecido
para eso. Se recomienda consultar cualquier libro de Estadística en lo relativo a
Estadística Descriptiva, por ejemplo, Estadística para Administración y Economía,
de D. R. Anderson, D. J. Sweeney y T. A. Williams, Editorial Thomson, Octava
edición, describe este proceso en la sección 2.2, Resumen de datos cuantitativos,
páginas 30 a 32.

Desarrollaremos este proceso con la variable PPA de nuestra base de datos,


dejando las otras dos variables, %PROP y RPV, para que sean desarrolladas por
el lector. En el proceso, utilizamos operaciones y funciones de EXCEL para
obtener los resultados deseados. Recuerde que para hacer operaciones en
EXCEL se resalta la celda donde se va a operar, se coloca =, se escribe formula u
operación señalando las celdas que van a ser operadas, y se aplica Enter para
que aparezca el resultado de la operación en la celda seleccionada. Si se va a
utilizar una función, se resalta la celda donde se va a localizar el resultado de la
función, se aplica la secuencia Formulas>Función>Estadísticas, o se hace click
sobre el icono fx , se selecciona en la lista la función requerida, se selecciona el
rango de datos resaltando la columna de los datos a operar, se introducen otros
parámetros si la función lo requiere, y al aplicar Enter aparece el resultado en la
celda seleccionada.

Para mayor ilustración se hace conveniente que, en la celda al lado izquierdo de


donde van a estar localizados los resultados de la operación o del cálculo de la
función, se coloque el nombre de la variable o función que está siendo calculada.

En este proceso de calculo de los Intervalos de clase, requerimos de los datos


mayor VM (obtenido con la función estadística Max) y menor Vm (obtenido con la
función estadística Min), del Rango R de datos que es la diferencia entre estos
dos valores, del Número de intervalos de clase m calculado por medio de la
Regla de Sturges (dada por la fórmula n ≈ 1+3,332 log n, siendo n el número de
datos y log el logaritmo en base 10 y dado como log10 en la lista de funciones
matemáticas), aproximando el valor resultante al entero mas próximo, y del Ancho
de clase a calculado como el Rango R dividido por el número de clases m.
Teniendo el ancho de clase a, se calculan los límites de cada intervalo,
comenzando por el valor del dato menor Vm y agregando el ancho de clase a
hasta terminar en el dato mayor VM.

Veamos el resultado de este proceso con los datos de la variable PPA:

Dato menor Vm: 11


Dato Mayor VM: 65,5
Rango R: 54,5
Regla de Sturges : 5,712211242
Número de Intervalos
m: 6
Ancho de Clase a: 9,083333333

Clase No. Lim. Inferior de clase Lim. Superior de Clase


1 11 20,08333333
2 20,08333333 29,16666667
3 29,16666667 38,25
4 38,25 47,33333333
5 47,33333333 56,41666667
6 56,41666667 65,5

Teniendo ya los intervalos de clase, podemos aplicar ahora el proceso de


construcción de la tabla de frecuencia. Para tal fin, comenzamos elaborando una
tabla de una columna con el título Clases que contenga solo los Límites
superiores de clase:

CLASES
20,08333333
29,16666667
38,25
47,33333333
56,41666667
65,5

Ahora, aplicamos la secuencia Datos>Análisis de Datos>Histograma. Si la


opción Análisis de Datos no está activada, desarrolle la secuencia Botón de
Office>Opciones de Excel> Complementos>Ir, y active la opción Herramientas
para análisis. Aplique Aceptar. Queda entonces activada Análisis de Datos.

Aplique de nuevo Datos>Análisis de Datos, seleccione la opción Histograma.


Entonces se despliega un cuadro de diálogo con las siguientes opciones:
Rango de entrada: Haciendo click en la flecha roja del cuadro pequeño, se
minimiza el cuadro de diálogo. Se selecciona toda la columna de datos de la
variable PPA, incluyendo el título, y se hace click de nuevo en el cuadro pequeño
de la flecha roja para recuperar el cuadro de diálogo. Ubíquese ahora en Rango
de clases.

Rango de clases: Repita el proceso de Rango de entrada, pero entrando ahora el


rango de la columna creada con el nombre de Clases.

Active la opción Rótulos si al marcar el rango de entrada incluyó el título de la


variable.

Rango de salida. Minimice el cuadro de diálogo y ubique la celda donde desea


que se localice la Tabla de frecuencia en la misma hoja de trabajo, y recupere el
cuadro de diálogo. Si desea la tabla de frecuencia En una hoja nueva, o En un
libro nuevo, escoja la opción.

Escoja Pareto (histograma ordenado), Porcentaje acumulado y Crear gráfico


si desea alguna de estas opciones.

Al aplicar Aceptar, se despliega la siguiente tabla de frecuencias:

CLASES Frecuencia % acumulado


20,08333333 10 34,48%
29,16666667 5 51,72%
38,25 4 65,52%
47,33333333 5 82,76%
56,41666667 3 93,10%
65,5 2 100,00%
y mayor... 0 100,00%
Como se escogió la opción Crear gráfico, la tabla anterior viene acompañada del
siguiente gráfico:
Histograma
12 120.00%
10 100.00%
8 80.00%
6 60.00%
Frecuencia

4 40.00% Frecuencia
2 20.00% % acumulado
0 0.00%
33 67 5 3 7 ,5 ...
3 3 66 8,2 333 666 65 ayor
3 3
33 66 3 66 ym
,08 ,16 ,33 ,41
2 0 2 9 4 7 5 6

CLASES

Observe que el gráfico contiene un Histograma de frecuencia absoluta y un


Polígono de frecuencia acumulada (Ojiva).

La tabla anterior puede ser elaborada a partir de la columna Lim. Superior de


Clase, para luego ser complementada con la columna Lim. Inferior de Clase y
obtener una tabla mas detallada. Para ello se repite el proceso anterior usando la
columna Lim. Superior de Clase de la tabla de diseño de clases al entrar el
Rango de clases. Al final se adiciona la columna Lim. Inferior de Clase al lado
izquierdo de la tabla resultante y se resaltan los márgenes. Veamos el resultado:

Lim. Inferior de Lim. Superior de %


Clase clase Frecuencia acumulado
11 20,08333333 10 34,48%
20,08333333 29,16666667 5 51,72%
29,16666667 38,25 4 65,52%
38,25 47,33333333 5 82,76%
47,33333333 56,41666667 3 93,10%
56,41666667 65,5 2 100,00%
y mayor... 0 100,00%

Queda para el lector la elaboración de tablas de frecuencia con este procedimiento


para las variables %PROP y RPV.

5. Elaborando gráficas para las tablas de frecuencia. Es de norma que las


Tablas de Distribución de Frecuencia estén acompañadas de gráficas que den una
interpretación paralela. Son ideales las gráficas de Columnas (Histogramas), de
Barras (Histograma horizontal), de Líneas (Polígonos) o Circulares (diagramas
circulares). Estos últimos son recomendables para frecuencias relativas
(frecuencias en porcentajes).

Para acceder a ellos, se aplica la secuencia Insertar>Gráfico…, y se selecciona


el tipo de gráfica deseada. Al seleccionar el gráfico de columna deseado, se aplica
Siguiente, se entra a un cuadro de diálogo donde se pide el Rango de datos. Se
hace click en el cuadro pequeño con la flecha roja para minimizar el cuadro de
diálogo, y se selecciona la tabla de frecuencia de Contar de Bolsa. De inmediato
aparece en el cuadro de diálogo la gráfica pedida. Al aplicar Siguiente>, se entra
a otras opciones del cuadro de diálogo como el Título del gráfico, y las leyendas
a colocar en el Eje de categorías (X): y en el Eje de valores (Y):. Llenando estos
datos y aplicando Siguiente> el cuadro de diálogo pregunta sobre la ubicación del
grafico. Seleccionando Como objeto en: y dando una ubicación en la hoja de
trabajo actual, se obtiene el gráfico siguiente asociado a la tabla de frecuencia de
Contar de Bolsa:

Contar de
BOLSA
BOLSA Total
AMEX 8
NYSE 6
OTC 15
Total general 29

Total
16
14
12
10
Total
8
6
4
2
0
AMEX NYSE OTC

Del mismo modo se pueden elaborar gráficos de linea para esta misma tabla, o
gráfico circulares para la tabla de Contar de Bolsa dada en porcentajes:
Contar de
BOLSA
BOLSA Total
AMEX 27,59%
NYSE 20,69%
OTC 51,72%
100,00
Total general %

Total
60.00%

50.00%

40.00%
Total
30.00%

20.00%

10.00%

0.00%
AMEX NYSE OTC

Total
60.00%
50.00%
40.00%
Total
30.00%
20.00%
10.00%
0.00%
AMEX NYSE OTC
Total

AMEX
NYSE
OTC

La opción desarrollada para la elaboración de la tabla de frecuencia con intervalos


de clase permite ordenar la elaboración de graficas, como se ilustró. Sin embargo,
se pueden ordenar otras gráficas para estas tablas con este mismo procedimiento.
Queda al lector la obligación de desarrollar gráficas para las tablas de frecuencia
obtenidas en el ejercicio del punto anterior.

Bibliografia:

- ANALISIS DE DATOS UTILIZANDO EXCEL. Mendoza R., Henry y Bautista


M., Gloria. Universidad Nacional de Colombia. Bogotá, 2003.
- ANALISIS DE DATOS CON MICROSOFT EXCEL. Berk, Kenneth N. y
Carey, Patrick. Ed. Thomson Learning. Mexico, 2001.

Potrebbero piacerti anche