Sei sulla pagina 1di 49

1.1. ¿QUÉ ES LA ESTADÍSTICA?

Es la ciencia de recolectar, organizar, presentar, analizar e interpretar datos para


ayudar en una toma de decisiones más efectiva. Para realizar esto, la Estadística
toma en cuenta las siguientes acciones:
Colección y recolección de datos

Ordenamiento de datos

Clasificación de datos

Presentación numérica
Presentación gráfica

Cálculo de estadígrafos

Relación entre dos o más variables

Proyección de datos
Análisis e interpretación de datos

1.2 DEFINICIÓN DE TÉRMINOS ESTADÍSTICOS


1. Estadígrafo. Es cualquier función de datos empíricos que se usa con fines
descriptivos o analíticos; son MEDIDAS DE RESUMEN ESTADÍSTICO de un conjunto
de datos. Por ejemplo: la media aritmética, la mediana, la varianza, el
coeficiente de correlación, etc.

2. Parámetro. Es el valor obtenido para describir en forma resumida las


características pertinentes o más importantes acerca de la población. Una
población puede tener muchas características y por lo tanto muchos parámetros
los parámetros son las MEDIDAS RESUMEN DE UNA POBLACIÓN, en tanto que las
medidas de una muestra se llaman estadígrafos.

3. Población. Conjunto finito o infinito de elementos o datos que presentan una


característica particular a ser analizada o estudiada. La población se presenta
con la letra N. Ejemplos:
La población formada por todos los alumnos del instituto (población finita o
numerable)
Todas las veces que aparece un tres (3) al tirar un dado.

4. Muestra. PARTE REPRESENTATIVA que se toma de una población con el fin de


investigar sus características.
La muestra se representa con la letra n.

5. Variable. Es toda la característica sujeta a medida, cuenta o calificación.


DATO QUE SUFRE VARIACIÓN dentro de una escala o recorrido.
Se representa con x, y, z.

Las variables pueden ser cuantitativas o cualitativas.


a. Variable Cuantitativa.- Se DESCRIBE MEDIANTE NÚMEROS. Los valores que
pueden ser ordenados y medidos. Esta variable a su vez se clasifica en:

DISCRETA:
Cuando toma VALORES ENTEROS, o es susceptibles de contar.
Generalmente se representa con X.
Ejemplos:
El número de miembros de una familia.
El número de habitaciones de un alojamiento.

CONTINUA:
Toma VALORES FRACCIONADOS o es susceptibles de medir generalmente se
representa con X.
Ejemplos:
Los pesos de la persona en Kg.
Las estaturas de las personas en metros.
Las remuneraciones de los empleados.
El tiempo de vuelo de una aeronave

b. Variable Cualitativa
Se expresa MEDIANTE PALABRAS o expresados de acuerdo por su nombre.
Se clasifica en:
ORDINAL
Son susceptibles de ordenamiento en forma implícita
Ejemplo:
El grado de instrucción

NOMINAL
Se expresan mediante sus propias denominaciones
Ejemplo:
La religión, color de los ojos, etc.

DICOTOMICA
Sólo asume uno de dos valores
Ejemplo:
sexo (femenino o masculino), etc.

POLITOMICA
Puede asumir cualquiera de varias alternativas
Ejemplo:
Nacionalidad (peruana, brasileña, etc.)

1.3 CLASES DE ESTADÍSTICA

1. Estadística Descriptiva
Aquella cuya finalidad es solamente la de DESCRIBIR EN FORMA GENERAL un
conjunto de datos, para posteriormente interpretarlos y PREPARAR
CONCLUSIONES GENERALES.

2. Estadística Inferencial
Aquella que realiza un ESTUDIO DETALLADO de los elementos de una
determinada muestra para posteriormente poder PROYECTARLOS o
GENERALIZARLOS a la población.

1.4 ETAPAS DE LA INVESTIGACIÓN ESTADÍSTICA


La investigación estadística es fundamentalmente de TIPO DESCRIPTIVO, se
preocupa de la confiabilidad, validez y significación de los datos, de las muestras,
así como de los métodos y técnicas de recolección y análisis estadístico. En este
proceso se distinguen las siguientes fases:

1ra. Recolección de datos. Se refiere a los MECANISMOS DE OBTENCIÓN DE LA


INFORMACIÓN; éstos don diversos y dependen de las posibilidades de acceso o
contacto con los elementos investigados, del tamaño de la población y de la
oportunidad de obtener datos.
2da. Organización de datos. Después de la recolección de datos se realiza una
evaluación, corrección y ajuste de datos. Luego se precede a la clasificación
para la AGRUPACIÓN DE DATOS.

3ra. Presentación de datos. Son los procedimientos de elaboración de la


información para ser presentados de acuerdo a un plan de TABULACIÓN que
puede ser en TABLAS ESTADÍSTICAS, CUADRO RESUMEN o GRÁFICOS.

4ta. Análisis e Interpretación de datos. A través de métodos estadísticos, se


calculan INDICADORES y MEDIDAS DE RESUMEN, se establecen relaciones entre
dos o más variables, se estiman valores, se ejecutan pruebas estadísticas: como
elementos de referencia para la descripción, análisis e interpretación del
comportamiento de os datos, HACER INFERENCIAS VALIDAS y OBTENER
INFORMACIÓN DE LOS ELEMENTOS o UNIDADES ESTUDIADAS.
CAPITULO II
DISTRIBUCIÓN DE FRECUENCIAS

2.1. TIPOS DE PRESENTACIÓN DE DATOS ESTADÍSTICOS


La presentación de datos estadísticos se realiza en dos formas:
a. Presentación Numérica: a través de los CUADROS ESTADÍSTICOS y TABLAS DE
FRECUENCIAS.
b. Presentación Gráfica: a través de una variedad de GRÁFICOS ESTADÍSTICOS.

2.2 PRESENTACIÓN NUMÉRICA


2.2.1 Cuadros estadísticos
El cuadro estadístico es el arreglo ORDENADO de columnas y filas de datos
estadísticos, con el objeto de ofrecer información estadística de fácil lectura,
comparación e interpretación.

Partes Principales: En general un cuadro estadístico puede tener 8 partes:


1) Número del Cuadro: Código o elemento de identificación que permite ubicar
el cuadro en el interior de un documento.
2) Título del Cuadro: Descripción resumida del contenido del cuadro. Debe ser
breve, claro y completo. Un título debe indicar:
a. QUE hay en el cuadro (característica principal)
b. DONDE corresponde la información, se refiere al lugar geométrico o institución
c. COMO están ordenados o clasificados los datos
d. CUANDO que momento o período de tiempo está referida la información
3) Concepto o encabezamiento: Son las descripciones de las filas y columnas del
cuadro. El encabezamiento se ubica en la parte superior del cuadro. Indica las
variables y sus categorías o valores.
4) Cuerpo del cuadro: Contenido numérico del cuadro. Presenta la distribución
de los elementos según la clasificación en categorías de las variables.
5) Notas del Pie o llamada: Usada para aclarar términos o siglas.
6) Fuente: Indicación al pie del cuadro, sirve para nombrar la publicación,
entidad, estudio o fuente de donde se obtuvieron los datos.
7) Nota de Unidad de Medida: Se escribe debajo del título original, usada cuando
se abrevia la escritura de las cifras y para indicar en que unidades está
expresada la variable.
8) Elaboración: Menciona al responsable de la elaboración del cuadro
estadístico final.

2.2.2 Tabla de distribución de frecuencia


Es el resumen que se realiza en función de la totalidad de elementos de una
población con respecto a una característica o variable de estudio.
Elementos de una tabla de distribución de frecuencias

1) Variable (Xi) Valor asociado a una determinada característica que toma


diferentes valores

2) Frecuencia Absoluta (fi) Número de veces que se repite un dato, como valor
de la variable. La suma de las frecuencias absolutas debe corresponder al
número de datos (n), es decir: f = n

3) Frecuencia Relativa (hi) Es el cociente de cada frecuencia absoluta entre el


número total de datos (n). Indica que porcentaje del total corresponde a cada
dato. Se calcula mediante:
fi
hi = --------
n
La suma de las frecuencias relativas debe ser uno (100%)

4) Frecuencia Absoluta Acumulada (Fi) Es la acumulación de cada frecuencia


absoluta. Para determinar la frecuencia acumulativa, se suma la frecuencia
acumulada anterior a la frecuencia absoluta, se decir:
F1 = f1
F2 = f1 + f2 = F1 + f2
F3 = f1 + f2 +f3 = F2 + f3
Lo que significa que la última frecuencia absoluta acumulada debe ser igual al
número de datos.

5) Frecuencia Relativa Acumulada (Hi) Es la acumulación de cada frecuencia


relativa. Se obtiene de forma similar a la frecuencia absoluta acumulada lo que
significa que la última frecuencia relativa acumulada debe ser igual a 1
También:
Fi
Hi = --------
n

6) Clases o Intervalos (m) Es el número de partes en que se divide a los elementos


de una población. Cuando no está determinada, se calcula por la formula de
Sturges:
m = 1 + 3.3 Log (n)

7) Amplitud (Ci) Es la diferencia entre el límite superior e inferior de cada intervalo.


Es el tamaño de cada clase. Indica el número de elementos que existe en cada
intervalo. Se calcula mediante: Ci = Ls - Li
Donde: Ls : límite superior Li : Límite inferior

8) Marca de clase (Yi) Es el punto medio de cada intervalo. Se calcula por:


Yi = (Ls + Li ) / 2

Ejemplo:

2.3 CONSTRUCCIÓN DE TABLAS DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


A. Para datos no agrupados
Por ser la información bastante pequeña, no existen las tablas de frecuencias, y
únicamente los datos se presentan ordenados, en filas o columnas.
Ejemplo: En una encuesta se obtuvo la siguiente información referente a la edad
de 10 personas:
19 31 22 30 25 27 42 33 50 21
Ordenado los datos y presentándolos en columna se tiene:
Edades (Xi)

B. Para datos agrupados sin intervalos


Se procede de la siguiente manera:
1) Identificar la variable en estudio (Xi)

2) Ordenar los datos en forma creciente (o decreciente)

3) Efectuar la respectiva tabulación de los datos

4) Calcular los elementos de la tabla de frecuencias

Ejemplo: En una encuesta de presupuestos familiares, se preguntó por el número


de hijos que tenía cada familia. Se entrevistaron 20 familias obteniéndose lo
siguiente:

1 2 4 3 6 3 3 8 2 4
6 4 1 0 3 2 2 1 2 2

Se pide completar la tabla de frecuencias:


Interpretando la tercera fila ( i = 3)
f3 =
h3 =
F3 =
H3 =
CAPITULO III
DISTRIBUCIÓN DE FRECUENCIAS AGRUPADAS

Distribución de Frecuencias de Datos Agrupados en Intervalos


Se procede de la siguiente manera:
1) Identificar la variable en estudio (Xi)
2) Calcular el rango (R ) de los datos, mediante: R = dato mayor - dato menor
3) Determinar el número de intervalos (m), en caso de que se desconozca
4) Calcular la amplitud (Ci) para cada intervalo, mediante Ci = R / m
5) Construir los intervalos, empezando por el dato menor, al cual se suma la
amplitud del intervalo.
6) Efectuar la tabulación respectiva
7) Calcular cada uno de los elementos de la tabla de distribución de frecuencias

Ejemplo: Las ventas mensuales de 50 restaurantes se dan a continuación en miles


de soles

35 42 27 25 55 22 52 38 22 60
47 15 25 48 63 36 39 37 54 29
29 15 22 27 37 11 45 33 66 35
46 29 11 27 35 17 40 34 35 37
42 18 39 23 38 51 12 36 27 63

Se pide:
i) Clasificar los datos en una tabla de distribución de frecuencias
ii) Interpretar ciertos elementos de dicha tabla
iii) Porcentaje de restaurante que tienen ventas mensuales menores de 35 mil
iv) Número de restaurante que tienen una venta mensual mayor o igual a 27 mil

Solución (i)
1) Variable Xi =
2) Rango R =
3) Intervalos m =
4) Amplitud C =

ii) Tabla de frecuencias


ii) Interpretar la tabla para i = 4
f4 =
h4 =
F4 =
H4 =

iii) Porcentaje de restaurantes que venden menos de 35 mil soles


iv) Número de restaurantes que venden más o igual a 27 mil soles

2.4 TABLA DE FRECUENCIA PARA VARIABLES CUALITATIVAS


La tabla de frecuencias en el caso de las variables cualitativas es similar a la
descrita para los datos agrupados sin intervalos.
Ejemplo: Se tiene 30 paquetes turísticos clasificados por zona del país, de
acuerdo a la siguiente clave: L = Lima, N = Norte, O = Oriente, S = Sur, C = Centro
Los datos son los siguientes:

L C L N C O C S N S
S N S C C N N L O S
S O N N S L L S L O
Se pide construir la tabla de distribución de frecuencias
CAPITULO IV
GRÁFICOS ESTADÍSTICOS

4.1 PRESENTACIÓN GRÁFICA DE DATOS ESTADÍSTICOS


Un Gráfico es una representación pictórica con el objeto de ilustrar los cambios
de una variable, para comparar visualmente dos o más variables similares o
relacionadas.
En estadística se emplea una diversidad de gráficos, cuya forma dependerá de
la naturaleza de los datos y del objetivo. Los gráficos de una variable sirven para
comparar cantidades absolutas, tasas, variaciones, etc. y pueden tener forma de
columnas, barras, puntos o líneas. Los gráficos de dos variables se construyen en
el plano cartesiano, teniendo en el eje X (abcisa) el registro de la variable
independiente; y en el eje Y (ordenada) se colocan los valores de la variable
dependiente.

Partes de un Gráfico
En todo gráfico se debe considerar el título, leyenda, escala, fuente y
elaboración; aunque dependiendo de la complejidad del gráfico, los elementos
pueden variar
A. Título: es una descripción del contenido del gráfico, explica el contenido se
coloca en la parte superior o inferior del gráfico
B. Diagrama: es el propio dibujo del gráfico, donde se encuentran ubicados los
datos.
C. Escala: es la unidad de medida que se considera en los ejes
D. Fuente: indica el origen de los datos, se ubica en la parte inferior del gráfico
E. Leyenda: Hace referencia al diagrama.
4.2 CLASIFICACIÓN DE GRÁFICOS
A. Lineales
1. En coordenadas rectangulares
Diagramas de frecuencias
Polígonos de frecuencias
Histograma de frecuencias
Series cronológicas
Nube de puntos, etc.
2. En coordenadas polares
Diagrama de telaraña

B. De Superficie, en este grupo se tiene:


Gráficos de barras verticales, simples, compuestas
Gráficos de barras horizontales, simples, compuestas
Coronas circulares
Pirámides
Cilindros, conos, etc.

C. Gráficos de dimensiones
De Área, cuando se consideran dos dimensiones
De Volumen, cuando se consideran tres dimensiones

D. Mapas estadísticos o cartogramas


E. Pictogramas

4.3 GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS

4.3.1 Gráfica de Variable Discreta


Este gráfico se denomina gráfico de bastones, donde en el eje X se registran los
valores de la variable (Xi) y en el eje Y se indican las frecuencias
Ejemplo: Graficar los siguientes datos, referidos a las edades de un grupo de
turistas
4.3.2 Gráfica de Variable Continua
Las representaciones gráficas de las distribuciones de frecuencias para una
variable continua se conocen como: histogramas y polígonos de frecuencias
A. HISTOGRAMA
Un histograma o Histograma de Frecuencias está formado por una serie de
rectángulos que tienen sus bases sobre un eje horizontal (eje X) e iguales a la
amplitud o tamaño de cada clase (Ci). Su altura es igual a la frecuencia de clase

B. POLÍGONO
Es un gráfico de líneas trazado sobre los puntos medio de cada clase (en el caso
de las frecuencias simple)
Se obtiene uniendo los puntos medios de los extremos superiores de cada
rectángulo del histograma. Se acostumbra prolongar el polígono hasta los puntos
medios inferior y superior de las clases inmediatas asumidas con frecuencia cero.

Para el caso de las frecuencias acumuladas, el polígono también se denomina


OJIVA, el cual se obtiene uniendo los límites superiores de cada intervalo a la
altura indicada por la respectiva frecuencia; para el primer intervalo se empieza
desde el límite inferior.

Ejemplo: Construir un histograma y un polígono de frecuencias para la


distribución de frecuencias de 400 tubos (en horas) e intervalos constantes.

Hrs. 300-400 500-600 700-800 800-900


Tubos 14 36 58 82 62 38 22
CAPITULO V
GRÁFICOS ESTADÍSTICOS ESPECIALES

Gráfica de Variable Cualitativa


Una distribución de frecuencias de variables cualitativas, pueden ser presentadas
gráficamente MEDIANTE UN DIAGRAMA DE BARRAS, en la cual la longitud de
cada barra es proporcional a la frecuencia del atributo que representa.
Las barras deben ser de igual ancho, pudiendo ser éstas horizontales o verticales.
También se puede utilizar GRÁFICAS CIRCULARES donde los sectores se obtienen
convirtiendo los porcentajes en ángulos sexagesimales, para lo cual debe
multiplicarse la frecuencia relativa (hi) por 360.
Ejemplo: La siguiente tabla muestra la superficie en millones de millas cuadradas
de los océanos del mundo.

Océano Antártico Ártico Atlántico Indico Pacífico


Superficie 7.6 4.8 41.2 28.5 70.8

Representar los datos utilizando:


a. Diagramas de barras
b. Diagrama circular
Otros Tipos de Gráficos Estadísticos
1. Columnas Dobles
Sirven para comparar dos series de datos referidos a datos estadísticos
Si se desea puede incluirse los rótulos de datos en las cabeceras de las columnas,
con lo cual puede omitirse la escala
2. Columnas Apiladas o Superpuestas
Permiten comparar los elementos con respecto al total
3. Diagrama de Líneas o Gráfico Poligonal
Se utiliza para representar series de tiempo (cronológicas) o cuando se requiere
presentar varias series de datos en el mismo gráfico.

4. Pictogramas
Son diagramas de figuras, donde las barras son reemplazadas por figuras que
representan la variable. Por ejemplo, la importación de automóviles podría
graficarse con la figura de un automóvil en la escala

Ejemplo:
La tabla estadística corresponde a la producción de naranja de un grupo de
valles correspondiente al II Semestre del año anterior expresado en miles de kg.

a. Graficar la producción de naranja Hualcará con barras verticales


b. Graficar la producción de naranja Francia y Hualcará con barras
compuestas

c. Graficar la producción total de naranja con un gráfico circular

d. Graficar la producción de naranja mediante barras verticales


incrementadas o apiladas
e. Graficar la producción de naranja Huando mediante barras horizontales
f. Gráfico Poligonal
Ventas mensuales en soles, de una empresa comercial (datos en miles de soles)

Mes Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
Ventas 18.9 21.7 18.9 9.9 15.5 17.6 25.3 12.2 14.2 21.2 15.6 17.1
CAPITULO VI
ESTADIGRAFOS DE TENDENCIA CENTRAL

6.1 DEFINICIÓN
Son estadígrafos que describen la posición que ocupan los datos alrededor de un
valor central. Se les conoce como PROMEDIOS, y permiten el análisis de una
distribución y la comparación entre distribuciones.
Los estadígrafos de tendencia central más importantes son: media aritmética,
media armónica, media geométrica, moda, mediana y los cuantiles.

6.2 LA MEDIA ARITMÉTICA


Es el cociente que resulta de dividir la suma de todos los datos entre el número de
observaciones.
Se le conoce como “media” o “promedio” y determina el punto medio de la
distribución. Se simboliza por X ó M[Xi
Los tipos de media aritmética son: media aritmética simple, ponderada y de
datos agrupados.

6.2.1 Media Aritmética Simple


Se suman todas las observaciones, y el total se divide entre el número de datos.

Donde:
Xi : variable o datos
n : número de datos

Ejemplo 1: Hallar la media aritmética de las siguientes edades:


9, 15, 12, 19, 17, 22

Ejemplo 2: Calcular el promedio de los precios:


5.7, 9.2, 6.4, 11.8, 13.7

Ejemplo 3: Si una alumna obtiene en la asignatura de Estadística las siguientes


notas: 16, 15, 14, 13 y 10; calcular el promedio
Ejemplo 4: Si los diámetros en pulgadas de una muestra de aros metálicos es la
siguiente: 0.211, 0.294, 0.465, 0.325, 0.373, 0.389, 0.256. Hallar la media de los
diámetros.

6.2.2 Media Aritmética Ponderada


En este caso la variable o dato es multiplicada por un “peso” o ponderación.
Para determinar el promedio la suma de estos productos se divide entre la suma
de los “pesos”

Donde:
xi : variable o dato
wi: ponderación
Ejemplo: La siguiente distribución corresponde al número de menús vendidos por
ciertos restaurantes en forma diaria. Hallar la media aritmética

Nro Menús 14 28 45 58 64 70
Nro Restauran 3 8 7 20 12 10

Solución

Ejemplo 2: Se ha clasificado a los turistas en 3 grupos de acuerdo a sus patrones


de gasto que constituyen el 60%, 30% y 10%. Si el promedio de gasto de cada
grupo es de 300, 420 y 650 dólares respectivamente; hallar el gasto promedio
total.
Elabore la solución
6.2.2 Media Aritmética de Datos Agrupados
En este caso los datos se encuentran agrupados en clases, para calcular la
media aritmética se utiliza la marca de clase (Yi) que corresponde a cada
frecuencia de clase, de decir:

Ejemplo: Hallar la media aritmética de la distribución de sueldos de una empresa


(en soles)

Sueldos 500-600 600-700 700-800 800-900 900-1000 1000-1200 1200-1800


Empleados 8 10 16 15 10 8 3

Solución

6.2.3 Propiedades de la Media Aritmética


1. La suma de las desviaciones ponderadas de los valores de la variable con
respecto de la media aritmética es cero
2. La media aritmética de una variable más (menos) una constante (k) es
igual a la media de la variable más (menos) la constante
3. La media aritmética de una variable multiplicada (dividida) por una
constante (k) es igual a la constante que multiplica (divide) a la media de
la variable
4. La media aritmética de la suma de dos ó más variables es igual a la suma
de las medias aritmética de cada una de las variables

6.2.4 Importancia de la Media Aritmética


La media aritmética es el centro de gravedad de la distribución
Es la medida de tendencia central más estable
Es el valor preferido en los cálculos estadísticos por ser el más fiable.
Es el promedio que mejor representa al grupo
Su mayor inconveniente es que su valor es sensible a valores extremos.

6.3 LA MEDIA ARMÓNICA


La Media Armónica (H) de una serie de n números: X1, X2, X3, ... Xn es la
recíproca de la media aritmética de los recíprocos de los números

Ejemplo: la media armónica de los números 2, 4 y 8 es:

En el caso de datos agrupados, la media armónica se calcula por

Donde: n es la suma de las frecuencias


Ejemplo 2: La siguiente tabla corresponde a la distribución de la carga máxima
en toneladas cortas (2000 libras) que soportan ciertos cables producidos por una
empresa. Determinar la media armónica

Máx
9.3 - 9.7 9.8 -10.2 10.3- 10.7 10.8- 11.2 11.3- 11.7 11.8- 12.2 12.3- 12.7 12.8- 13.2
carga
Nro
2 5 12 17 14 6 3 1
cables
Solución

6.3 LA MEDIA GEOMÉTRICA


La Media Geométrica (G) de una serie de n números X1, X2, X3 ... Xn es la raíz
enésima del producto de los números

Ejemplo 1 : Calcular la media geométrica de los números 2, 4 y 8

Para datos agrupados se considera la marca de clase (Y)

Aplicando logaritmos

Ejemplo 1: Determinar la media geométrica de la distribución de remuneraciones


de un grupo de trabajadores de la Empresa Delta
6.3.1 Aplicaciones de la Media Geométrica
La media geométrica es útil para encontrar el promedio de porcentajes, razones,
tasas de crecimiento

Ejemplo 1. Suponga que recibe un aumento de 5% en su sueldo el año pasado, y


recibirá uno de 15% este año. El aumento porcentual promedio es:

Es decir el aumento porcentual promedio es 9.886%


Ejemplo 2. Las ganancias obtenidas por la empresa constructora Alfa en 4
proyectos recientes fueron de 3%, 2%, 4% y 6% ¿Cuál es la media geométrica de
las ganancias?

Una segunda aplicación de la media geométrica es encontrar un aumento


porcentual promedio en un intervalo de tiempo.
La tasa de aumento se determina a partir de:

Ejemplo. Suponga que el número de alojamientos turísticos en cierta ciudad eran


2 en 1992 y para el 2002 era 22 ¿Cuál es la tasa de incremento porcentual anual
promedio para el período?

La tasa de aumento anual es de 27.1% al año

6.5 LA MEDIANA
La Mediana de una colección de datos ordenados por su magnitud,
corresponde al valor de la variable que divide al número de frecuencias en 2
partes iguales. Esto significa que a uno y otro lado de este valor medio se
encuentra no más del 50% de los datos. Se simboliza por Me
6.5.1 Mediana de una Distribución Simple
Para calcular la Mediana, los datos se ordenan en forma ascendente o
descendente, y luego se observa:
a) Si el número de datos es impar la Mediana es igual al valor central
b) Si el número de datos es par la Mediana es igual al promedio de los dos
valores centrales.
Ejemplo 1. Hallar la mediana de las siguientes notas:
15, 10, 12, 14, 8

Ejemplo 2. Hallar la mediana del número de empleados:


12, 10, 18, 13, 11, 21

Ejemplo 3. Hallar la mediana de los siguientes costos unitarios de producción de


componentes:
0.24, 0.31, 0.52, 0.27, 0.38, 0.42, 0.62, 0.46

6.5.2 Mediana de una Distribución Agrupada


La Mediana determina el punto medio de la distribución, dividiéndola en dos
partes iguales. Para calcularla se halla las frecuencias absolutas acumuladas y
luego se calcula n/2 para determinar la clase mediana.

Donde
Me : Mediana
n/2 : forma de ubicar la clase mediana
Fj-1 : Frecuencia absoluta acumulada continua
inferior con respecto a la clase mediana
Fj : Frecuencia absoluta acumulada de la clase mediana
Li : Límite inferior de la clase mediana
Cj : Amplitud del intervalo mediano

Ejemplo 1. Hallar la mediana de la siguiente distribución correspondiente al costo


del pasaje en dólares a ciertas capitales latinoamericanas
Ejemplo 2. Hallar la mediana de la siguiente distribución correspondiente a las
edades de los turistas que visitaron cierta atracción turística

6.5.3 Importancia de la Mediana


No es afectada por los valores extremos
Aplicable a distribuciones con extremos indeterminados
Su desventaja radica en no considerar todos los datos

6.6 LA MODA
Es el valor más frecuente de una variable, es decir es el valor más común
Se simboliza por Mo

6.6.1 Moda de una Distribución Simple


Es el dato estadístico que se repite el mayor número de veces
Puede ser unimodal, bimodal o multimodal
Ejemplo 1. Hallar la moda de las siguientes notas:
10, 13, 14, 12, 14, 11, 14, 12, 14

Ejemplo 2. Hallar la moda de los siguientes precios


3.8, 4.2, 5.3, 7.2, 3.9, 5.3, 4.2, 4.1, 4,5

6.6.2 Moda de una Distribución Agrupada


Determina el punto medio de la distribución
Para hallar la moda se ubica la mayor frecuencia absoluta y su clase se le
denomina clase modal. Luego se ubican las frecuencias absolutas que son
inferior y superior respecto a la clase modal.

Donde
Mo : Moda
d1 : fj - fj-1 diferencia premodal
d2 : fj - fj+1 diferencia postmodal
Li : Límite inferior del intervalo modal
Cj : Amplitud del intervalo modal

6.6.3 Importancia de la Moda


* Aplicable a datos cualitativos

* No es afectada por valores altos o bajos de la distribución

* Cálculo rápido

* Tiene como desventaja el perder validez cuando es multimodal

Ejemplo 1. Hallar la moda para la siguiente distribución correspondiente al


número de trabajadores en empresa hoteleras, donde n = 200
Ejemplo 2. Hallar la moda para la siguiente distribución de un grupo de empresas
de transportes, donde la utilidad se expresa en miles de dólares

6.7 CUANTILES
Si una serie de datos se colocan en orden de magnitud, el valor que divide al
conjunto de datos en dos partes iguales es la Mediana. Por extensión, se puede
dividir los datos en tantas partes como se requiera.

6.7.1 Cuartiles
Son los valores que dividen a los datos en cuatro partes iguales, se representan
por Q1, Q2, Q3 denominados primer, segundo y tercer cuartil respectivamente.
El primer cuartil representa el 25% de las observaciones.
El segundo cuartil es el valor central y es igual a la Mediana.
El tercer cuartil es un valor que representa hasta el 75% de los datos
La ecuación de los cuartiles es igual que la ecuación de la Mediana variando
solo la forma de ubicar la clase cuartil
Forma de ubicar la clase cuartil
Q1 --> 1n/4 = n/4 Q2 --> 2n/4 = n/2 Q3 --> 3n/4 = 3n/4

Ecuación

Ejemplo 1. Determinar los cuartiles de la distribución donde n = 400

6.7.2 Deciles
Son estadígrafos de posición que dividen a la distribución en diez partes iguales,
encontrándose en cada una de ellas no más del 10% de las observaciones. El
quinto decil es igual que la Mediana
Los deciles se representan con la letra D.
Forma de ubicar la clase decil
D1 --> 1n/10 = n/10 D2 --> 2n/10 = n/5 ... D9 -->9n/10 = 9n/10
Ecuación del k-ésimo decil:
Ejemplo. Determinar el segundo y octavo decil

6.7.3 Percentiles
Es una medida de posición que divide a la distribución en cien partes iguales. En
donde cada una de ellas corresponde al 1% de los datos.
Se representa por “P”
El percentil quincuagésimo (P50) es igual a la Mediana
Los percentiles P25 y P75 corresponden al cuartil Q1 y Q3 respectivamente. De
igual forma el percentil P10 corresponde al decil D1 y así sucesivamente
Forma de ubicar la clase percentil
P1-->1n/100 = n/100 P2-->2n/100 = n/50 ... P99-->99n/100 = 99n/100
Ecuación del k-ésimo percencil:

Ejemplo. Determinar los percentiles P25, P60 y P95


6.7.4 Terciles
Esta medida de posición divide a la distribución en tres partes iguales
representando cada una de ellas un tercio de la distribución
Se representa con “T”
Forma de ubicar la clase tercil o tercila

El tercio medio equivale a T1, T2 y el tercio superior a Li, T1


Ecuación:

6.7.5 Quintiles
Es la medida de posición que divide a la distribución en cinco partes iguales.
Se representa con “K”
Forma de ubicar la clase quintila
K1 -->1n/5= n/5 K2 -->2n/5= 2n/5 ... K4 -->4n/5= 4n/5
El quinto superior equivale a Li, K1
Ecuación de los quintiles (m es el k-ésimo quintil):

Ejemplo. Calcular el tercio medio, el tercio superior y el quinto superior


CAPITULO VII
ESTADIGRAFOS DE DISPERSIÓN ABSOLUTA

7.1 DEFINICIÓN
Los estadígrafos de dispersión son medidas que nos dan la mayor o menor
concentración de observaciones o datos con respecto a un valor central.
Miden el grado de dispersión o concentración de los datos o valores, alrededor
de algunas de las medidas de tendencia central.

Los estadígrafos de dispersión son los siguientes:


A. Medidas de Dispersión Absoluta
* Rango o Recorrido
* Varianza
* Desviación Estándar
B. Medidas de Dispersión Relativa
* Coeficiente de Variación
* Coeficiente de Asimetría
* Coeficiente de Curtosis

7.2 EL RECORRIDO O RANGO


Está definido por la diferencia existente entre el mayor valor y el menor valor de
una variable estadística.
R = XM - Xm
Donde:
XM : Mayor valor de la variable
Xm : menor valor de la variable
Cuando mayor es el rango, mayor es la dispersión de los datos alrededor de la
medida de tendencia central; aunque debe considerarse que el rango depende
de la distancia que existe entre sus dos valores extremos con relación a los demás
valores.

Ejemplo 1. Determinar el rango para las siguientes notas:


12, 13, 15, 18, 10, 05, 04

Ejemplo 2. Determinar el rango en la siguiente distribución (miles $)


7.3 LA VARIANZA
Es el promedio del cuadrado de las desviaciones de la variable respecto a la
media aritmética
Se representa por V(x) ó S2
Proporciona información sobre el grado de dispersión de los valores de una serie
con respecto a su media aritmética; mientras mayor sea el valor de la varianza,
mayor es la dispersión. Lo anterior implica que cuanta más pequeña sea la
varianza, mayor es la concentración de los datos alrededor de la media
aritmética.

7.4 LA DESVIACIÓN ESTÁNDAR O TÍPICA


Mide el grado de normalidad de la distribución de datos de la muestra alrededor
de la media aritmética dentro de sus valores extremos; es decir mide la dispersión
alrededor de la media.
La desviación estándar se define como la raíz cuadrada (positiva) de la varianza
y se representa por S

7.5 CÁLCULO DE LA VARIANZA Y LA DESVIACIÓN ESTÁNDAR


7.5.1 Distribución Simple
Ejemplo. Determinar la desviación estándar de los resultados en la evaluación de
7 alumnos: 7, 5, 10, 11, 13, 15, 16

7.5.2 Distribución Agrupada

Ejemplo 1. Determinar la desviación estándar para la siguiente distribución sobre


lesiones promedio por cada 1000 horas-hombre de una industria

Ejemplo 2. Determinar la desviación estándar de la distribución de ingresos


quincenales (en dólares) de los empleados de Beta S.A.C. durante la última
quincena del mes pasado
7.5.3 Propiedades de la Varianza

1. La Varianza de una constante es cero


2. Al multiplicarse una variable por una constante, la varianza se multiplica por la
constante al cuadrado
3. Al sumarse una constante a la variable, la varianza no cambia

7.5.4 Intervalos de Dispersión


Ventas mensuales Mayor dispersión --> Mayor Irregularidad
Comportamiento del PBI Mayor dispersión --> Mayor Inestabilidad
Rendimiento de Acciones Mayor dispersión --> Mayor Riesgo
Si “n” es grande (n>30) la distribución es aproximadamente simétrica, porque
tiene la forma de la curva normal, en donde se presentan tres casos:
1. El 68% de los datos se encuentran en el intervalo X - S, X + S
2. El 95.5% de los datos están comprendidos dentro del intervalo: X - 2S, X + 2S
3. El 99.7% de los datos se encuentran en el intervalo X-3S, X+3S
CAPITULO VIII
ESTADIGRAFOS DE DISPERSIÓN RELATIVA

8.1 MEDIDAS DE DISPERSIÓN RELATIVA


Características
* Medidas expresadas en porcentaje
* Generan información de alta o baja dispersión por sí solos
* Mayor porcentaje implica mayor dispersión

8.1.1 Coeficiente de variación


Es útil para realizar comparaciones cuando se usan diferentes unidades de
medida de la variable
Se emplea también cuando se comparan dos distribuciones con diferente
número de observaciones

Se interpreta como el porcentaje de variabilidad de los datos con respecto a la


media aritmética
Por convención, si el coeficiente de variación es mayor a 15% la dispersión es alta
Ejemplo. Con los siguientes datos, calcular el coeficiente de variación:
0.32 0.44 0.51 0.72 0.77 0.91
8.1.2 Medidas de asimetría
El grado de oblicuidad de una distribución puede ser medido mediante los
coeficientes de asimetría o deformación
Las medidas de dispersión solamente indican la magnitud de las variaciones,
pero no proveen información acerca de la dirección hacia donde tienden a
ocurrir las variaciones

Por tanto, las medidas de asimetría no sólo indican la falta de simetría en la


distribución sino también la dirección hacia donde se inclina la distribución.
Si una distribución es simétrica, no tiene sesgo, es decir, su asimetría es nula.

Si una o más observaciones son sumamente grandes, la media de la distribución


se vuelve mayor que la mediana o moda. En tales casos se dice que la
distribución tiene asimetría positiva o sesgo positivo. Por el contrario, si hay una o
más observaciones muy pequeñas, la media es la menor de las tres medidas de
tendencia central, y se dice que la distribución tiene asimetría negativa o sesgo
negativo.

1. Coeficiente de Asimetría de Pearson (A1)


Se define por la siguiente relación entre media aritmética, mediana, moda y
desviación estándar

Se presentan los siguientes resultados:


A1 > 0 la media aritmética se inclina a valores extremos altos y por tanto existe
asimetría positiva
A1 = 0 la distribución es simétrica
A1 < 0 la media aritmética se inclina a valores extremos bajos y por tanto existe
asimetría negativa

Ejemplo. Graficar el histograma y calcular el coeficiente de asimetría de la


producción de una máquina durante 23 días
producción 0-5 5-10 10-15 15-20 20-25
días 3 5 7 5 3

2. Coeficiente de Asimetría de Fisher (A2)


Se define por la siguiente fórmula

Se presentan los siguientes resultados:


A2 > 0 asimetría positiva
A2 = 0 la distribución es simétrica
A2 < 0 asimetría negativa

3. Coeficiente de Asimetría de Bacley (A3)


Emplea los cuartiles en su fórmula
Se presentan los siguientes resultados:
A3 > 0 asimetría positiva
A3 = 0 la distribución es simétrica
A3 < 0 asimetría negativa

Ejemplo. Determinar la asimetría de la distribución de salarios quincenales de los


obreros de la Constructora Delta (datos en dólares)
CAPITULO X
NUMEROS INDICES

10.1 NÚMEROS INDICES


Es el cociente de cualquier medición de una variable (o más variables) con
respecto a una de sus mediciones que se toma como base.
El objetivo de los números índices es cuantificar variaciones de las mediciones de
una variable a través del tiempo.
Las mediciones pueden estar relacionadas con:
Cantidad

Precio
Valor.

Los números indices se clasifican en:


índices simples o elementales
índices compuestos o agregados.

El número índice simple se calcula a partir de una sola variable. Mientras que un
índice compuesto se calcula a partir de dos o más variables. Los índices
compuestos se clasifican en índices no ponderados e índices ponderados.

10.2 INDICES SIMPLES


Se denomina índice simple de X para el período t con respecto al período base
t0, al número definido por:

El porcentaje de variación entre los valores Xo y Xt se calcula por:

Si el porcentaje de variación es positivo se dice que ha habido un incremento, si


es negativo se dice que ha habido una baja.
Ejemplo. En el cuadro se dan los sueldos promedios (en dólares) de los
trabajadores de una empresa. Calcular los índices con respecto a cada base.
10.3 INDICES SIMPLES DE PRECIOS, DE CANTIDADES Y DE VALOR
Se denomina índice simple de precios en el período t con respecto al período
base t0, al número definido por:

Se denomina índice simple de cantidades en el período t con respecto al período


base t0, al número definido por:

Se denomina índice simple de valor en el período t con respecto al período base


t0, al número definido por:

Donde PtQt y P0Q0 son los valores respectivos en el período t y en el período base.
Ejemplo: Se tiene los precios promedios en dólares y las cantidades de consumo
promedio en Kg de un artículo. Tomando como base el 2000, calcular los índices
de precios, de cantidades y de valor para los otros años
10.4 INDICES COMPUESTOS O AGREGADOS
Se define como una combinación de números índices simples cada uno de ellos
referidos a una misma base.

10.4.1 Índices Compuestos no Ponderados


Es el cociente de la suma de las medidas de dos o más variables en el período t
entre la suma de las medidas de esas variables en el período base t0
El índice agregado simple de precios de varios artículos en un período t con
respecto al período base t0 se define por:

El índice agregado simple de cantidades de varios artículos en un período t con


respecto al período base t0 se define por:

El índice agregado simple de valor de varios artículos en un período t con


respecto al período base t0 se define por:

Ejemplo. En la tabla se tiene una canasta de artículos básicos con sus precios y
cantidades. Tomando como base el 2003 calcular los índices compuestos no
ponderados de precios y cantidades.
10.4.2 Indices Compuestos Ponderados
Las ponderaciones usadas para índices compuestos de precios son las
cantidades de los bienes o ítems y viceversa.
El índice de precios de Laspeyres en un período t con respecto al período base t0
se define por:

El índice de precios de Paasche en un período t con respecto al período base t0


se define por:

Ejemplo. En la tabla se tiene una canasta de artículos básicos con sus precios y
cantidades. Tomando como base el 2000 calcular los índices compuestos
ponderados de precios.

Potrebbero piacerti anche