Sei sulla pagina 1di 25

Estadística Descriptiva

a) Introducción, concepto y definición de Estadística

Rama de las matemáticas que se ocupa de reunir, organizar y analizar datos numéricos, y
que ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones.

La estadística es la ciencia que tiene por objeto dar métodos tanto para la recopilación,
clasificación, organización y análisis de los datos que provienen de un grupo de individuos,
como su aplicación para decidir la aceptación o rechazo de ciertas afirmaciones o leyes.

Busca las características generales de los colectivos, no considerando las particularidades


de los elementos que forman dicho colectivo, a este colectivo se le denomina Población.

La estadística se ocupa de recopilar datos, clasificarlos, organizarlos en tablas y gráficos


y analizarlos con un determinado objetivo.

b) La estadística y sus usos, Métodos Estadísticos

La materia prima de la estadística consiste en conjuntos de datos numéricos obtenidos al


contar o medir cosas. Al recopilar datos estadísticos se ha de tener especial cuidado para
garantizar que la información sea completa y correcta.

El primer problema para los estadísticos reside en determinar qué información y cuánta
se ha de reunir. La dificultad al compilar un censo está en obtener el número de habitantes
de forma completa y exacta; los estadísticos enfrentan un complejo problema cuando, por
ejemplo, toman una muestra para un sondeo de opinión o una encuesta electoral, el
seleccionar una muestra capaz de representar con exactitud las preferencias del total de
la población no es tarea fácil.

Para establecer una ley física, biológica o social, el estadístico debe comenzar con un
conjunto de datos y modificarlo basándose en la experiencia. Por ejemplo, en los primeros
estudios sobre crecimiento de la población los cambios en el número de habitantes se
predecían calculando la diferencia entre el número de nacimientos y el de fallecimientos
en un determinado período.

La estadística puede ser descriptiva o inferencial.


a) La estadística descriptiva aplica procedimientos que sirven para organizar y resumir
conjuntos de datos numéricos, trata de la presentación en gráficas, tabula en
distribución de frecuencias, representa y describe una serie de datos que pueden ser
cuantitativos o cualitativos, aplicando diversas Medidas de Tendencia Central, Medidas
de Posición y Medidas de Variación, sin sacar conclusiones.

Lic. Rafael N. Pacheco García 1


Estadística Descriptiva

b) La estadística inferencial aplica procedimientos que sirven para deducir o infiere


propiedades acerca de un gran número de datos (población) seleccionando o
recogidos de un grupo menor de ellos (muestra).

Conceptos Básicos

a) Población o Universo:
Conjunto de individuos, objetos, o fenómenos a observar y que tienen alguna
característica en común, motivo de una investigación y en los que se desea estudiar un
fenómeno determinado.

Una población puede ser finita o infinita, la población formada por “todos los enfermos
cardíacos” es infinita, mientras que la población constituida “por todos los enfermos
cardíacos del Hospital A” es finita.

Sin embargo, en la mayoría de los casos la población está formada por un número tan
grande de elementos que no es materialmente posible obtener información de todos
ellos, por esta razón, se acostumbra trabajar con una parte de la población.

b) Muestra:
Subconjunto de una población, es un pequeño universo. Se usa cuando la población es
infinita o sumamente grande y es imposible observar todos sus elementos, es una parte
de la población en la cual se efectúa el estudio del fenómeno.

Si una muestra es representativa de una población, de ella se pueden deducir importantes


conclusiones acerca de ésta, a partir del análisis de la misma.

c) Elemento (e)
Es cada integrante de la población o muestra. En estadística un elemento puede ser algo
con existencia real.
Ejemplo: un automóvil, o algo más abstracto, como un voto, la temperatura, el tiempo.
También puede ser unidades naturales: obreros, turistas, empleados, emigrantes, etc.

d) Parámetro
Conjunto de medidas características (resultados), o valores numéricos cuando se han
obtenido a partir de una población.
Ejemplo: Edad promedio de los estudiantes en la Facultad de Ingeniería.

e) Estadístico
Conjunto de medidas características (resultados) cuando se han obtenido a partir de una
muestra.

Lic. Rafael N. Pacheco García 2


Estadística Descriptiva

Ejemplo: Edad promedio de los estudiantes en II año en la Facultad de Ingeniería.

f) Datos
Son medidas, valores, variables, o características susceptibles de ser observados y contados.

g) Dato Estadístico:
Son datos que se considera participar en el estudio estadístico, más concretamente, los
valores que pueden obtenerse de la observación para formar la muestra. (un dato aislado
que no se integra o que no muestra relación significativa con otro, no es dato estadístico).

h) Variable Estadística
Es el objeto en estudio de una determinada población. La misma que puede ser cualitativa
y cuantitativa.

i) Variable Cualitativa
Cuando los valores se expresan mediante un atributo o característica que no se pueden
medir. Ejemplo: Color de los ojos, el género, carrera o estado civil de los integrantes de este
grupo de estudiantes.

j) Variable Cuantitativa:
Cuando los valores se puede medir o expresar mediante números y puede ser: discreta y
continua.
Ejemplo: Número de estudiantes de Ingeniería Industrial en el presente grupo. Profesores
Universitarios. Gasto promedio diario en concepto de alimentación

 Variable Cuantitativa Discreta


Cuando toma valores enteros (no toma valores entre dos números enteros consecutivos).
Ejemplo: Alumnos de la carrera de Comunicación social. Edad en años de los alumnos.
Cantidad de hermanos de una persona.

 Variable Cuantitativa Continua


Cuando puede tomar infinitos valores intermedios entre dos números enteros consecutivos.
Ejemplo: El peso corporal, el salario mensual de un trabajador, altura de un árbol de
pino.

k) Valores de la Variable
Son los números pertenecientes a dicha variable.
La estatura, edad, etc., se obtienen al observar las características cuantitativas en los
elementos de la población o muestra. Aunque todos los elementos posean los mismos
caracteres o características, estos no se presentan siempre con la misma intensidad, o sea
no todas las personas tienen la misma estatura, la misma edad, etc. En consecuencia la

Lic. Rafael N. Pacheco García 3


Estadística Descriptiva

observación produce distintos números que son los valores de la variable.

l) Valores Posibles
Son los valores que puede tener la variable y que tiene la posibilidad de ser o suceder.
Ejemplo: Un alumno al presentarse a un examen parcial tiene la posibilidad de obtener una
calificación entre 0 y 25 puntos, así la variable calificación puede tomar ¿Cuántos valores?
Lo correcto es 26 valores distintos. A este conjunto se lo llama valores posibles.

m) Valores Observados
Conjunto de valores posibles que han sido determinados, fijados o identificados.
Ejemplo: La calificación de los cinco primeros alumnos que se presentaron a la
evaluación de matemática son 10, 12, 14, 11, 19, a este conjunto se le denomina valores
realmente observados.

Ejemplo:
Se desea realizar un estudio sobre el número de hijos por familia en los municipios del
departamento de Masaya
- Población: familias de los municipios de Masaya.
- Individuo: cada una de las familias.
- Muestra: elegimos una muestra aleatoria (al azar) de 1000 familias distribuidas por
todos municipios
- Tamaño de la muestra: 1000
- Variable: número de hijos. Es una variable cuantitativa discreta.

Ejemplos:
1. Se desea realizar un estudio estadístico de las estaturas de los estudiantes de primer
año de ingeniería,
 Población: conjunto de mediciones de estaturas
 Individuo: estatura de cada estudiante
 Atributo: la estatura
2. Teniendo presente la clasificación, clasifica los siguientes atributos
a) Afiliación política de los habitantes de un municipio.
b) Cantidad de ganado vacuno en Esteli.
c) Religión de los padres de familia de la comunidad educativa de la UdeM.
d) Ingresos de los obreros de la construcción.
e) Cantidad de alumnos de las diferentes carreras de la Facultad de Ciencias de la UNAN.
f) Sexo de los estudiantes de la escuela de periodismo.
g) Estado civil de los habitantes de la ciudad El Rama.
h) Cantidad de películas nacionales estrenadas durante un año.
i) Color de cabellos de los alumnos de este curso.
j) Puntaje obtenido por los alumnos de nuevo ingreso a la carrera de Medicina.

Lic. Rafael N. Pacheco García 4


Estadística Descriptiva

c) Diseño Muestral
i. UNIVERSO
El universo debe ser definido desde los objetivos del estudio y puede serlo en términos
geográficos (una localidad, un municipio, un distrito, una provincia, un país o cualquier
otra categoría intermedia) o en términos sectoriales (la población urbana, las industrias de
cerámica, los productores de leña). También se debe dar límites temporales a la definición
del universo, porque su composición y características pueden cambiar con el correr del
tiempo.
El universo se define en forma preliminar al inicio del diseño metodológico de un estudio,
para después precisarlo al conocer su tamaño y distribución espacial y temporal, a través
de la revisión de informaciones existentes. La redefinición del universo puede significar
ampliarlo o reducirlo.

ii. MARCO MUESTRAL


Una vez definido el universo, se debe recabar información, lo más exacta posible, de sus
dimensiones y distribución espacial y temporal, para con ello poder construir el marco
muestral, que es la base para hacer el diseño de muestreo. El marco muestral es la
información que ubica y dimensiona al universo y puede consistir de censos de vivienda
y mapas agrupados por localidades, barrios, repartos, etc.; mapas de cobertura forestal
con agrupamientos por tipos de vegetación o usos del suelo; listados de viviendas en
localidades pequeñas, etc.

iii. UNIDAD DE MUESTREO


Un concepto básico en la teoría del muestreo, que debe definirse claramente para
construir el marco muestral, es la unidad de muestreo, que es la unidad mínima de
observación de la que se obtendrá información de las variables útiles. Por convención
estadística, se usará "N" para referirnos al número de unidades de muestreo que integran
el Universo y "n" para el número de unidades de muestreo en la muestra. Otras unidades
de muestreo pueden ser definidas de acuerdo a los objetivos de los estudios.
Después de haber definido el universo y la unidad muestral, y de contar con un marco
muestral, el diseño del muestreo consiste de dos grandes etapas: definición del tipo de
muestreo y determinación del tamaño de muestra.

iv. TIPO DE MUESTREO

I. Muestreo probabilístico (aleatorio):


En este tipo de muestreo, todos los individuos de la población pueden formar parte de la
muestra, tienen probabilidad positiva de formar parte de la muestra. Por lo tanto es el tipo
de muestreo que deberemos utilizar en nuestras investigaciones, por ser el riguroso y
científico.

Lic. Rafael N. Pacheco García 5


Estadística Descriptiva

II. Muestreo no probabilístico (no aleatorio):


En este tipo de muestreo, puede haber clara influencia de la persona o personas que
seleccionan la muestra o simplemente se realiza atendiendo a razones de comodidad.
Salvo en situaciones muy concretas en la que los errores cometidos no son grandes,
debido a la homogeneidad de la población, en general no es un tipo de muestreo riguroso
y científico, dado que no todos los elementos de la población pueden formar parte de la
muestra. Por ejemplo, si hacemos una encuesta telefónica por la mañana, las personas
que no tienen teléfono o que están trabajando, no podrán formar parte de la muestra.

Muestreo aleatorio simple


En un muestreo aleatorio simple todos los individuos tienen la misma probabilidad de ser
seleccionados. La selección de la muestra puede realizarse a través de cualquier
mecanismo probabilístico en el que todos los elementos tengan las mismas opciones de
salir.

Muestreo aleatorio estratificado


Es frecuente que cuando se realiza un estudio interese estudiar una serie de
subpoblaciones (estratos) en la población, siendo importante que en la muestra haya
representación de todos y cada uno de los estratos considerados. El muestreo aleatorio
simple no nos garantiza que tal cosa ocurra. Para evitar esto, se saca una muestra de cada
uno de los estratos.
Hay dos conceptos básicos:

Estratificación:
El criterio a seguir en la formación de los estratos será formarlos de tal manera que haya
la máxima homogeneidad en relación a la variable a estudio dentro de cada estrato y la
máxima heterogeneidad entre los estratos.

Afijación:
Reparto del tamaño de la muestra en los diferentes estratos o subpoblaciones. Existen
varios criterios de afijación entre los que destacamos:
a) Afijación igual: Todos los estratos tienen el mismo número de elementos en la muestra.
b) Afijación proporcional: Cada estrato tiene un número de elementos en la muestra
proporcional a su tamaño.
c) Afijación Neyman: Cuando el reparto del tamaño de la muestra se hace de forma
proporcional al valor de la dispersión en cada uno de los estratos.

Muestreo aleatorio sistemático


Es un tipo de muestreo aleatorio simple en el que los elementos se seleccionan según un
patrón que se inicia con una elección aleatoria.

Lic. Rafael N. Pacheco García 6


Estadística Descriptiva

Considerando una población de N elementos, si queremos extraer una muestra de tamaño


n, partimos de un número h=N/n, llamado coeficiente de elevación y tomamos un número
al azar a comprendido entre 1 y h que se denomina arranque u origen.

La muestra estará formada por los elementos: a, a+h, a+2h,....a+(n-1)h.


De aquí se deduce que un elemento poblacional no podrá aparecer más de una vez en la
muestra. La muestra será representativa de la población pero introduce algunos sesgos
cuando la población está ordenada en función de determinados criterios.

Muestreo aleatorio por conglomerados o áreas


Mientras que en el muestreo aleatorio estratificado cada estrato presenta cierta
homogeneidad, un conglomerado se considera una agrupación de elementos que
presentan características similares a toda la población.

Por ejemplo, para analizar los gastos familiares o para controlar el nivel de audiencia de
los programas y cadenas de televisión, se utiliza un muestreo por conglomerados-familias
que han sido elegidas aleatoriamente.

Las familias incluyen personas de todas las edades, muy representativas de las mismas
edades y preferencias que la totalidad de la población.
Una vez seleccionados aleatoriamente los conglomerados, se toman todos los elementos
de cada uno para formar la muestra. En este tipo de muestreo lo que se elige al azar no
son unos cuantos elementos de la población, sino unos grupos de elementos de la
población previamente formados. Elegidos estos grupos o "conglomerados" en un
número suficiente, se pasa posteriormente a la elección, también al azar, de los elementos
que han de ser observados dentro de cada grupo, o bien, según se desee, a la observación
de todos los elementos que componen los grupos elegidos.

v. TAMAÑO DE LA MUESTRA

El tamaño de la muestra debe definirse independientemente para cada universo, en


función de tres factores: la variabilidad de la variable numérica más importante, el nivel de
confianza fijado y el nivel de error aceptable. Esto se resume en la siguiente fórmula:
no = (s2 . t2 , )/ e2 (1) en términos de varianza y error absoluto
ó
no = (cv2 . t2 , )/ e2 (2) en términos de cv y error relativo
donde:
 no = tamaño de la muestra
 s2 = varianza de la muestra

Lic. Rafael N. Pacheco García 7


Estadística Descriptiva

 t2 = valor crítico de la distribución t de Student, con un nivel de significancia _


y _ grados de libertad
 e = error aceptable
 cv = coeficiente de variación = desviación estándar de la muestra/ media
muestral
 = grados de libertad = n - 1
La varianza (s2) o el coeficiente de variación (cv) indican el grado de heterogeneidad u
homogeneidad de la variable de interés en la muestra y se los calcula con los datos de
una muestra preliminar o de algún estudio previo.
El error aceptable (e) se refiere a la diferencia que se permite entre la media de la
muestra y la media del universo. Se fija de acuerdo al conocimiento previo que se tiene
del fenómeno y es aconsejable que se encuentre entre el 10% y el 20%, lo cual puede
expresarse también en valores absolutos con las unidades de medición de la variable en
cuestión.
El valor crítico de t se obtiene de tablas en libros de estadística o Excel, definiéndose
primero el nivel de significancia ( ) o su complemento, el nivel de confianza (1- ). Para
este tipo de estudios es suficiente con un nivel de confianza de 0.95, que equivale a =
0.05(2). Además, se debe fijar preliminarmente un número de casos de la muestra (n)
para definir los grados de libertad ( = n-1). Estos dos valores son los datos de entrada
de las tablas de t. Posteriormente, por medio de un proceso iterativo, en donde el valor
de n obtenido con la Fórmula 1 se utiliza para encontrar el valor de t, se precisa el tamaño
de la muestra.
En esta fórmula se aprecia que el número de elementos que componen la muestra es
directamente proporcional a la varianza y al valor de t cuadrado, e inversamente
proporcional al cuadrado del error. El tamaño de muestra será grande cuando:
a) el fenómeno en estudio sea muy variable (varianza o coeficiente de variación alto);
b) el nivel de confianza fijado sea alto; y/o
c) el error aceptable sea bajo.
En cambio, el tamaño de la muestra será pequeño si encontramos un fenómeno poco
variable, fijamos una confianza baja y se acepta un error alto.
Con ello queda demostrado que el tamaño de una muestra NO depende del tamaño del
universo. Así, por ejemplo, partiendo de iguales niveles de confianza y error aceptado,
en un bosque tropical húmedo con la misma superficie que un bosque templado de
pino, el tamaño de muestra será mayor en el primero porque es sabido que tiene más
heterogeneidad en la variable existencia de madera que el bosque de pino.
Hasta ahora no se ha considerado el tamaño del universo para determinar el tamaño de
muestra. Sin embargo, para universos pequeños, menores a 120 U.M., es necesario
corregir el valor de no obtenido de la Fórmula 1, a través del uso de la Fórmula:
n = no / (1 + no / N) (2)
donde:
 no = tamaño de muestra obtenido en la fórmula anterior

Lic. Rafael N. Pacheco García 8


Estadística Descriptiva

 N = tamaño del universo


 n = tamaño definitivo de muestra

d) Escalas de Medición
Una escala es un sistema para asignar valores numéricos a ciertas características o rasgos
mensurables.
Existen varios métodos para ordenar datos. En la mayoría de los casos, las técnicas de
medición se pueden reducir a cuatro tipos de escalas: nominal, ordinal, de intervalos y de
razón.

Escala Nominal: a cada elemento que se está observando o midiendo se le asigna un


número o nombre distinto, por ejemplo, un número, letra o número romano.
Ejemplos:
La asignación de números a un grupo de jugadores de beisbol.
Sexo: hombre, mujer
La variable corresponde a esta escala cuando los sucesos elementales se usan para
clasificar personas, características u objetos en categorías que no admiten jerarquización
ni cuantificación de los datos.

Escala Ordinal: La variable bajo medición se ordena o jerarquiza, sea cual fuere la
diferencia de magnitud entre puntajes.
Ejemplo, la jerarquización de personas o puntajes según alguna medida particular, como
el lugar que ocupan en la clase, del primero al último o del más alto al más bajo.
Una escala ordinal dirá, por ejemplo, quien fue primero, segundo o tercero.
Nivel socioeconómico: alto, medio, bajo.

Escala de Intervalo: En una escala de intervalos se obtiene una unidad específica de


medición, que es de tal naturaleza, que la distancia o diferencia entre cualesquier dos
números adyacentes es idéntica a la de cualesquier otros dos números. Las mediciones
ocupan un lugar en una escala de puntajes de intervalo constante. Ejemplo, el logro
académico se mide usualmente en escalas porcentuales o calificaciones de 1 a 10.

Escala de Razón: Son variables cuyos sucesos elementales, además de ordenarlos


jerárquicamente, permiten hacer comparaciones entre un par de valores, pero esta vez
afirmando cuantas veces es mayor o menor un valor que otro, es decir existe un cero
absoluto.
Ejemplo: Juan tiene en ahorros 15,000, su hermana Rosa posee 30,000, lo que indica que
Rosa tiene el doble de ahorros que Juan.

Lic. Rafael N. Pacheco García 9


Estadística Descriptiva

En estadística descriptiva debemos tener en cuenta las siguientes etapas:

a) Recolección de datos
b) Organización de datos
 Tabulación
 Gráficas
c) Análisis y medición de datos

a. Recolección de datos

b. Organización de los datos


Tabulación: puede ser a través de una serie simple, con la presentación de los datos
recogidos en forma de tabla ordenada, o a través de la agrupación de datos, este método
se utiliza cuando el número de observaciones es muy grande.
Gráficas: la recopilación de datos y la tabulación pueden traducirse gráficamente
mediante representaciones convenientemente elegidas: barras, sectores circulares, mapas
curvas, etc.
Los gráficos permiten visualizar e interpretar el fenómeno que se estudia, en forma más
clara.
Las barras se utilizan generalmente para representar atributos cualitativos o cuantitativos
discreto. La longitud es igual a la frecuencia de cada observación. Pueden ser barras
simples o múltiples, según se trate de representar uno o más atributos.
Las barras pueden ser horizontales o verticales.

c. Análisis y medición de datos


Para describir un conjunto de datos, se calculan algunas medidas que resumen la
información y que permiten realizar comparaciones.

Medidas de posición: se utilizan para encontrar un valor que represente a todos los datos.
Las más importantes son: la media aritmética, la moda y la mediana.

Presentación de datos e intervalos de clases


 Agrupación de datos por serie o distribución de frecuencias: se registra la
frecuencia de cada valor de la variable. La frecuencia puede ser absoluta (f), número
que indica la cantidad de veces que la variable toma un cierto valor, o relativa (fr),
cociente entre la frecuencia absoluta de cada valor de la variable y el número total de
observaciones.

Tema 2: Distribuciones de Frecuencias

Lic. Rafael N. Pacheco García 10


Estadística Descriptiva

La materia prima de la estadística consiste en conjuntos de números obtenidos al contar


o medir objetos. Al recopilar datos estadísticos se ha de tener especial cuidado para
garantizar que la información sea completa y correcta. El primer problema para los
estadísticos reside en determinar qué información y cuanta se debe reunir.

1. Distribución de Frecuencias

¿Por qué es importante la estadística en la investigación?:


o Permiten el tipo de descripción más exacto.
o Nos obligan a ser claros y precisos en nuestros procedimientos.
o Nos facilitan resumir resultados de manera significativa.
o Nos permiten deducir conclusiones.
o Nos ayudan a predecir.
o Nos conducen a someternos a análisis y críticas, etc.

Para recopilar los datos, podemos recurrir al medio interno o al externo. Lo primero
cuando se hace dentro de la organización, y la segunda cuando se los obtiene de datos
publicados, o por medio de la aplicación de una técnica de investigación (entrevista,
encuesta, ficha de observación, etc.).

La muestra que elegimos debe ser representativa de tal manera que las conclusiones a las
que lleguemos sean válidas para la población.

Es un instrumento que permite sintetizar y/o presentar la información de un hecho


investigado, y consta de cinco elementos principales.

 CABEZA: parte inicial donde se registra el título.


 COLUMNA PRINCIPAL: Aquí anotamos las categorías ordenadas obtenidas.
 ENCABEZADO DE COLUMNAS: Símbolos que explican el objeto en estudio, o las
características fundamentales que dan lugar al ingreso de la información (vaciado de
datos).
 CUERPO: Conjunto de datos estadísticos realmente observados y distribuidos de
acuerdo a las características predeterminadas.
 FUENTE: Referencia donde se adquiere la información.
Las tablas o cuadros estadísticos no tienen modelo único, están sujetos a las exigencias
de la información y del investigador.

Si tenemos datos estadísticos que los podemos manejar también los podemos ordenar.
Si luego de la recopilación, obtenemos un conjunto de datos estadísticos demasiado
numeroso, poco o nada se puede hacer con ellos. Pero si los organizamos y los
clasificamos se nos va a facilitar la información incluso la interpretación.

Lic. Rafael N. Pacheco García 11


Estadística Descriptiva

La forma más correcta es en una tabla de distribución de frecuencias, y su elaboración no


requiere ningún artificio especial, basta con anotar los datos en fila o en columna.
Una ordenación tabular de los datos en clases, reunidas las clases y con las frecuencias
correspondientes a cada una, se conoce como una Distribución de Frecuencia o Tabla de
Frecuencia.

Cuando elaboramos estas tablas se debe tener presente lo siguiente:


 Si se trabaja con variables discretas las clases pueden ser sin agrupamiento, siempre y
cuando su recorrido sea menor a 20.
 Cuando trabajamos estadísticas de variables continuas y por lo general numerosa,
debemos agrupar, o por lo general cuando su rango sea mayor a 20.

Por consiguiente podemos obtener 3 tipos de series:


1. Serie simple o tipo I, también llamada ordinaria (cuando las estadísticas representan
un rango menor a 10).
2. Serie de frecuencia, o tipo II (cuando las estadísticas o datos observadas se repiten y
su rango esta entre mayor a 10 y menor que 20).
3. Serie de intervalos de clase o tipo III, o de datos agrupados (cuando los datos
observados son numerosos o su rango es mayor que 20).

 Número de casos (n): Es el total de casos de una determinada investigación o tamaño


de muestra.
 Amplitud, Rango o Recorrido (A o R): Es la diferencia entre el valor mayor y el valor
menor de la variable.
 Serie Estadística: Conjunto de valores de una variable, que se encuentran ordenados
en sentido ascendente o descendente, también se conoce como tabla o cuadro
estadístico.
 Intervalos de Clase: Cuando trabajamos con datos mayores a 20 es necesario agrupar
los mismos. El conjunto formado en cada clase se llama intervalo de clase.
 Ancho de Clase O Ancho de Intervalo (C): Es la diferencia entre los dos límites de
cada clase más uno. O la diferencia entre los dos límites reales de un intervalo.

Por ejemplo en el intervalo 60 - 62. El ancho del intervalo es 3. O en ese intervalo hay 3
elementos: 60, 61, 62. Por lo tanto C = 3.
 Número de Intervalos (K): Es el cociente entre la amplitud y el ancho del intervalo.

En los libros de estadística “No hay normas definidas respecto al número de clases que
deben utilizarse en una distribución de frecuencias. Sobre esto podemos decir que
escoger bien el número de clases es un arte en el que priman la experiencia y la intuición:
Si los intervalos de clase son muy pocos, se pierden detalles; y si son muchos, aparte de
los tedioso del trabajo, se manifiestan irregularidades que no permiten apreciar

Lic. Rafael N. Pacheco García 12


Estadística Descriptiva

claramente un patrón de comportamiento.


En todo caso, la mayoría de analistas recomiendan no menos de 5 ni más de 18 intervalos
de clase. Por regla general los intervalos de clase son iguales, pero si esto no es
posible entonces será forzoso usar intervalos de diferentes anchuras e intervalos abiertos”

 Límites de Clase (li - ls): Son los valores extremos de cada intervalo. Por lógica el valor
menor es el límite inferior y el valor mayor corresponde al límite superior.
 Limites Reales (Li - Ls): También son de dos clases. El límite real superior se lo obtiene
sumando 0.5 a cada extremo superior y el límite real inferior se obtiene restando 0.5
al valor menor de cada intervalo, siempre y cuando estemos con valores discretos.
 Punto Medio o Marca de Clase (Xm): Es el valor central de un intervalo. Por
consiguiente es considerado como el elemento representativo de esa clase. También
se lo define como valor medio o valor promedio del intervalo.
 Frecuencia (f): Indica el número de veces que se repite cada dato, o caso, también se
llama frecuencia absoluta.
 Frecuencia Relativa (Fr): Indica la parte del total que corresponde a cada dato. Por lo
tanto va hacer siempre un decimal.
 Frecuencia Acumulada (Fa): Como su nombre lo indica es la acumulación de las
frecuencias obtenidas al sumar las mismas desde la menor variable.
 Porcentajes (%): Es el indicador del valor correspondiente por cada 100 casos del
total.

Aunque en el proceso de agrupamiento generalmente se pierde parte del detalle original


de los datos, tiene la importante ventaja de presentarlos a TODOS en un sencillo cuadro
que facilita el hallazgo de las relaciones que pueda haber entre ellos, puestas así de
manifiesto. Ejemplo: Altura de 100 estudiantes de UdeM
Altura en Número de
pulgadas estudiantes
60 – 62 5
63 – 65 18
66 – 68 42
69 – 71 27
72 – 74 8
Total 100

Un símbolo que define una clase, tal como 60 – 62 en la tabla anterior, se conoce como
intervalo de clase. Los números 60 y 62, son los límites de clases, el numero 60 es el
límite inferior de la clase y el mayor 62 es límite superior.
Los términos clases e intervalo de clase se utilizan a menudo indistintamente, aunque el
intervalo de clase es realmente un símbolo para la clase. Un intervalo de clase

Lic. Rafael N. Pacheco García 13


Estadística Descriptiva

que, al menos teóricamente, no tiene límite superior o inferior, se conoce como intervalo
de clase abierto, por ejemplo “mayores de 75 pulgadas” o “menores de 59 pulgadas”.
Limites Reales de Clase:
En el intervalo de clase 60 – 62, teóricamente incluye todas las medidas desde 59.5 a 62.5,
estos números se conocen como limites reales de clase o limite verdaderos de clases, el
menor de ellos se conoce como límite real inferior (59.5) y limite real superior (62.5)
Punto Medio o Marca de clase:
Así la marca de clase del intervalo del primer intervalo 60 – 62 es 61.

Reglas Generales para construir una Distribución de Frecuencia


 Determinar el mayor y el menor entre los datos registrados y calcular el rango “R”, que
es la diferencia entre el valor mayor y el menor.
 El ancho ‘C’ de cada intervalo se determina dividiendo el rango ‘R’ en un número de
intervalos de clase del mismo tamaño, este número conveniente ‘K’ se calcula con la
fórmula K = 1+3.322log(n) donde n es el número de casos o datos registrados para el
estudio. Los intervalos de clases se eligen de forma que las marcas de clases o puntos
medios coincidan con datos realmente observados. Esto tiende a aminorar el
llamado error de agrupamiento.
 Determinar el número de observaciones que caen dentro de cada intervalo de clases,
esto es encontrar las frecuencias de clases.

2. Análisis, clasificación e interpretación de gráficos estadísticos

 Gráficas de Barras o Rectángulos: están constituidos por un conjunto de barras o


rectángulos, separados por distancias iguales, que representan distintas categorías o
clasificaciones que hacemos del fenómeno que se desea dar a conocer.
 Histograma de Frecuencias: son gráficas de barras verticales en los que se construyen
las barras rectangulares en los límites de cada clase. Se representan las
medidas de las observaciones que están agrupadas, en una escala horizontal, las
frecuencias de clase en una escala vertical y dibujando rectángulos cuyas bases sean
iguales al intervalo de clase y cuyas alturas están determinadas por las
correspondencias de clases.
Cuando se cambian los valores de la escala vertical por los valores de Frecuencia
Relativa, el histograma se llama Histograma de Frecuencias Relativas
 Polígono de Frecuencia: las frecuencias de clase se toman en las marcas o centros de
clases y los puntos sucesivos se unen mediante segmentos de rectas.
 Sectores o Diagrama Circular: se construye sobre la base de un círculo que
representa el total de frecuencias de las distintas categorías en que se divide un
atributo, dividiendo este círculo en tantos sectores circulares como categorías tenga el
atributo. La magnitud del ángulo de los sectores se calcula al dividir la frecuencia
absoluta de cada categoría por el total de datos.

Lic. Rafael N. Pacheco García 14


Estadística Descriptiva

 Tallos y hojas: el tallo es el dígito o dígitos que encabezan la fila (a la izquierda) y la


hora es el dígito que termina la fila. El tallo se coloca a la izquierda de una línea
vertical y la hora a la derecha de la misma.
 Gráfica de Líneas: consiste en un conjunto de líneas o segmentos de rectas que
muestran los cambios que experimenta una determinada variable, generalmente en
función del tiempo, en el eje horizontal de anota el tiempo y en el vertical la frecuencia
con que aparece la unidad de tiempo.
 Ojiva es una gráfica de una distribución de frecuencias (o de frecuencias relativas)
acumuladas y comienza con una frecuencia relativa igual a cero asociadas a la frontera
inferior de la primera clase, y termina con una frecuencia relativa de 100% asociada a
la frontera superior de la última clase

Tipos de Curvas de Frecuencia:


Las curvas de frecuencia presentan determinadas formas características que les distinguen
como se indican a continuación:
a) Las curvas de frecuencias simétricas o bien formadas, se caracterizan por el hecho de
que las observaciones que equidistan del máximo central tienen la misma frecuencia.
b) En las curvas de frecuencia moderadamente asimétricas o sesgadas la cola de la curva
a un lado del máximo central es mayor que al otro lado. Si la cola mayor se presenta a
la derecha de la curva se dice que está sesgada a la derecha o que tiene sesgo positivo,
mientras que si ocurre lo contrario se dice que es sesgada a la izquierda o que tiene
sesgo negativo.
c) En las curvas de forma de J o de J invertida, el máximo se presenta en un extremo.
d) Las curvas de frecuencia en forma de U tienen el máximo en ambos extremos.
e) Una curva de frecuencia bimodal tiene dos máximos.
f) Una curva de frecuencia multimodal tiene más de dos máximos.

Ejemplo:
Se han obtenido las siguientes mediciones en libras del peso de 80 alumnos de edades
comprendidas entre 17 y 35 años del Curso de Estadística Descriptiva
105 221 183 186 121 181 180 143
97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
Construimos la Tabla de Distribución de Frecuencias de la siguiente manera:

Lic. Rafael N. Pacheco García 15


Estadística Descriptiva

a) Rango = Xmáx – Xmin = 245 – 76 = 169


b) Numero de intervalo: K = 1+3.322log(80) = 7.322  7
c) Ancho del intervalo es: C = Rango/K = 169/7 = 24.14  25
d) Límite inferior del primer intervalo: No hay una regla fija para determinar esta
puntuación, para algunos autores debe ser la puntuación mínima observada (76), para
otros debe ser un múltiplo de la amplitud del intervalo y según otros la observación
menor debe ser el punto medio del primer intervalo.

Porcentuales
Intervalos de Limites Reales Punto Frec.
Frec. Frec. Frec. Rel.
clases o Exactos Medio Abs. Grados
Rel. Acum. Acum.
76 100 75.5 100.5 88 3 3.75 3 3.75 13.5
101 125 100.5 125.5 113 8 10.00 11 13.75 36
126 150 125.5 150.5 138 16 20.00 27 33.75 72
151 175 150.5 175.5 163 27 33.75 54 67.50 121.5
176 200 175.5 200.5 188 17 21.25 71 88.75 76.5
201 225 200.5 225.5 213 5 6.25 76 95.00 22.5
226 250 225.5 250.5 238 4 5.00 80 100.00 18

Gráficos asociados a Tabla de Distribución de Frecuencias

I. Diagrama de Pastel
Peso en libras de alumnos del curso Estadistica Descriptiva
226 250 76 100
5% 4%

201 225 101 125


6% 10%

176 200
21%
126 150
20%

151 175
34%

Lic. Rafael N. Pacheco García 16


Estadística Descriptiva

II. Histograma
Peso en libras de alumnos del curso Estadistica Descriptiva
30

25

20

15

10

0
76 - 100 101 - 125 126 - 150 151 - 175 175 - 200 201 - 225 226 - 250

III. Polígono de Frecuencias


Peso en libras de alumnos del curso Estadistica Descriptiva

30

25

20

15

10

0
88 113 138 163 188 213 238

Lic. Rafael N. Pacheco García 17


Estadística Descriptiva

IV. Ojiva o Polígono de Frecuencias Acumuladas


Peso en libras de alumnos del curso Estadistica Descriptiva
100.00
90.00
80.00
70.00
60.00
50.00
40.00
30.00
20.00
10.00
0.00
3 11 27 54 71 76 80

V. Tallos y Hojas
Tallo Hojas Frecuencia
7 6 1
8 7 1
9 7 1
10 5, 1 2
11 5, 8, 0 3
12 1, 0, 3 3
13 4, 1, 3, 5, 3, 5 6
14 2, 9, 5, 8, 3, 1, 6, 9 8
15 4, 7, 1, 3, 4, 0, 8, 8, 6, 8, 0, 8 12
16 3, 0, 7, 3, 0, 5, 0, 8, 7, 9 10
17 8, 5, 4, 4, 1, 6, 2, 1, 0, 6 10
18 0, 3, 6, 1, 4, 1, 0 7
19 9, 6, 0, 9, 3, 4 6
20 7, 1, 0, 8 4
21 8 1
22 1, 8, 9 3
23 7 1
24 5 1
Total 80

Lic. Rafael N. Pacheco García 18


Estadística Descriptiva

Ejercicios
1) Los datos que a continuación se presentan corresponden a las horas extras laboradas
por un grupo de trabajadores de la empresa FERRANICA.
103; 84; 110; 38; 116; 70; 93; 73; 80; 112; 107; 45; 125; 50; 82; 42; 75; 47; 96; 69; 52;
75; 87; 61; 48; 64; 123; 81; 50; 86; 65; 51; 68; 114; 29; 107; 79; 76; 128; 53; 78; 117;
58; 40; 119; 89; 57; 92; 106; 90; 104; 30; 99; 73; 102; 77; 33; 39; 72; 91
Elabore: Una distribución de frecuencia de clase completa, Un Histograma y Polígono de
frecuencia

2) Durante el mes de Julio una compañía telefónica registró los siguientes números de
llamadas de cincuenta clientes:
30; 34; 12; 45; 36; 60; 23; 12; 43; 35; 65; 45; 23; 47; 26; 56; 46; 27; 63; 64; 34; 24; 56;
45; 23; 34; 56; 56; 23; 18; 53; 52; 43; 45; 23; 43; 43; 65; 43; 23; 43; 12; 23; 45; 54; 34;
23; 32; 12; 32
Elabore: Una distribución de frecuencia de clase completa, Un Gráfico de Pastel y Polígono
de frecuencia

3) Los siguientes valores corresponden a las alturas de mujeres dadas en metros:


1,50; 1,52; 1,52; 1,53; 1,54; 1,55; 1,56; 1,57; 1,57; 1,57; 1,58; 1,58; 1,60; 1,60; 1,62;
1,62; 1,64; 1,65; 1,65; 1,65; 1,65; 1,68; 1,68; 1,69; 1,69; 1,69; 1,70; 1,70; 1,70; 1,70;
1,70; 1,70; 1,72; 1,72; 1,73; 1,76
Elabore: Una distribución de frecuencia de clase completa, Un Histograma y grafico de
pastel

4) Los datos siguientes corresponden a mediciones en gramos de albumina total


circulante en pacientes varones de edades comprendidas entre 25 y 35 años
124 116 144 133 108 120 146 114 112 110
115 123 138 127 111 125 137 132 140 121
126 130 139 131 125 142 124 122 123 139
Elabore: Una distribución de frecuencia de clase completa, Una Ojiva y grafico de pastel.

Lic. Rafael N. Pacheco García 19


Estadística Descriptiva

Tema 3: Medidas de Tendencia Central:


Pueden definirse varias medidas de tendencia central, las más comunes y utilizadas son la
Media, la Mediana y la Moda. Cada una tiene sus ventajas y sus inconvenientes,
dependiendo la aplicación de una u otra del tipo de variables y de la forma de la
distribución.

1. MODA
La moda de un conjunto de datos se representa por Mo y corresponde al valor de la
variable que presenta mayor frecuencia.
El cálculo de la moda se puede aplicar tanto a variables cuantitativas, cualitativas, como
cuasi cuantitativas o cualitativa ordinal.
 Cuando estamos trabajando con variables cualitativas y cuasi cuantitativas, la moda
corresponde a la modalidad de la variable que presenta mayor frecuencia.
 Cuando trabajamos con variables cuantitativas hay que hacer la siguiente distinción:

 Datos No Agrupados: corresponde al valor de la variable de mayor frecuencia.


 Datos Agrupados en Intervalos: los intervalos tienen la misma amplitud.

= + ∗
( − )+( − )
Li-1 es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.

Se puede obtener un valor aproximado mediante:

= + ∗
+

Las distribuciones de frecuencias con una sola moda se denominan UNIMODALES, sin
embargo puede darse el caso de distribuciones con dos modas, que se denominan
distribuciones BIMODALES. Una distribución que contenga más de dos modas se
denominan MULTIMODAL.

Características de la Moda:
 Es muy sencilla de calcular, se determina por inspección y no por cálculo numérico.
 Con los datos agrupados en intervalos, la moda depende del número de intervalos
elegidos, de su amplitud y de sus límites.
 Puede ser calculada aunque alguno de los intervalos carezca de límites, siempre y
cuando la moda no se encuentre en ese intervalo.

Lic. Rafael N. Pacheco García 22


Estadística Descriptiva

2. MEDIANA
La mediana de una serie de N datos ordenados en orden creciente o decreciente se
representa por Me y es la puntuación que ocupa el valor central de la distribución
estadística.
El cálculo de la mediana siempre suele ser calculada para variables cuantitativas, por lo
tanto hay que tener en cuenta la siguiente distinción.

 Datos No Agrupados:
a) Si hay un número impar de datos, la mediana viene dada por el valor Central.
b) Si hay un número par de datos, la mediana es la media aritmética de las dos
puntuaciones centrales.

Ejemplos Calcular la mediana


 Consideremos los salarios en córdobas para 11 vendedores; 6,196.5, 8,160, 7,930.50,
6,477, 5,967, 6,655.5, 6,094.5, 7,905, 5,559, 6,808.5, 7,318.5.
 Consideremos los salarios en dólares para 12 vendedores; los cuales se han presentado
ordenados anteriormente 218, 234, 239, 243, 254, 261, 267, 287, 310, 311, 320 y 322.

 Datos Agrupados en Intervalos


En este caso el valor de la mediana se obtiene mediante la fórmula:

= + 2 ∗

Donde
Li es el límite exacto inferior del intervalo crítico
n es el número total de datos
nd es el número de datos por debajo del intervalo crítico
nc es la frecuencia del intervalo crítico
C es la amplitud del intervalo

Características de la Mediana:
 Es menos sensible que la media a la variación de cada una de las puntuaciones.
Al variar una puntuación cambia la media, mientras que la mediana puede
permanecer invariable.
 Con los datos agrupados en intervalos, la mediana depende del número de intervalos
elegidos, de su amplitud y de los límites de los mismos.
 Puede ser calculada aunque alguno de sus intervalos carezca de límites, siempre y
cuando la mediana no se encuentre en ese intervalo, en cuyo caso tampoco podrá ser
calculada.

Lic. Rafael N. Pacheco García 23


Estadística Descriptiva

 Es más representativa que la media cuando la distribución de frecuencias tiene


puntuaciones extremas, puesto que la mediana depende de los valores centrales de la
distribución y no es afectada por los valores extremos.

3. MEDIA ARITMÉTICA
La media aritmética o media de una serie de N datos de observaciones X 1, X2, X3,..., Xn se
representa por X y se define como la suma de todos los valores de una variable dividida

por el número total de datos. X


 X i  x1  x2  x3  ...  xn
N N
El cálculo de la media aritmética solo se puede aplicar a variables cuantitativas, por tanto,
debemos tener en cuenta la siguiente distinción:
 Datos no agrupados:
Cuando los datos no se encuentran agrupados en intervalos, el cálculo de la media

se reduce a la simple aplicación de la fórmula X 


 X i  x1  x2  x3  ...  xn .
N N
 Datos agrupados en intervalos:
Si, por el contrario, tenemos los distintos valores de la variable agrupados en intervalos,
el procedimiento para calcular la media varía en algunos aspectos:
- Para empezar, se utiliza el punto medio de cada intervalo para representar todos los
valores contenidos dentro del mismo.
- el punto medio de cada intervalo se multiplica por su frecuencia correspondiente; se
suman estos productos y el resultado se divide por N

X
 ni X j  n1 x1  n2 x2  n3 x3  ...  nn xn
N N
 Características de la media:
 La media es muy sensible a la variación = de las puntuaciones.Basta con que varíe
una sola puntuación para que varíe la media.
2, 9, 3, 7, 4 tienen media igual a 5 pero 2, 19, 3, 7, 4 tienen media igual a 7
 Con los datos agrupados en intervalos, la media depende del número de intervalos
elegidos, de su amplitud y de los límites de los mismos. No se puede calcular
la media si alguno de sus intervalos carece de límites.

4. MEDIA ARMÓNICA
La media armónica H de una serie de N números es la recíproca de la media aritmética de
los recíprocos de los números, se emplea para promediar variaciones con respecto al
tiempo.
1 N
H N

1

1 1

N j 1 X j X

Lic. Rafael N. Pacheco García 24


Estadística Descriptiva

3 3
Ejemplo: La media armónica de los números 2, 4, 8 es H    3.43
1 1 1 7
 
2 4 8 8

5. MEDIA GEOMÉTRICA
La media geométrica G de una serie de N números es la raíz N ésima del producto de los
números: G  N X 1 X 2 X 3 X N
Existen dos usos principales de la media geométrica:

1. Para promediar porcentajes, índices y cifras relativas y


2. Para determinar el incremento porcentual promedio en ventas, producción u otras
actividades o series económicas de un periodo a otro.

Ejemplo:
La media armónica de los números 2, 4, 8 es G  2* 4*8  64  4
3 3

 Un fabricante dispone $600,000 anuales para la compra de materia prima. Durante tres
años invierte la misma cantidad de dinero. Si el precio promedio por kg ha aumentado
en los últimos tres años sucesivamente de $2,200 a $2,280 y luego a $4,600. ¿Cuál es
el precio promedio que ha pagado el fabricante en los tres años?

6. MEDIA PONDERADA
A veces se asocia a los números X1, X2, X3,..., Xk ciertos factores o pesos w1, w2, w3,..., wn
que dependen de la significación o importancia de cada uno de los números. En este caso

X
 wX  w1 x1  w2 x2  w3 x3  ...  wk xk se llama media aritmética ponderada
w w1  w2  w3  ...  wn

Ejemplo: si un examen final de curso se valora como tres veces los exámenes parciales y
un estudiante tiene una nota de examen final de 85 y notas de exámenes parciales de 70
y 90, su nota final será
70  90  3*85 415
X    83
11 3 5
Ejemplo:
1. El primer examen parcial vale el 20%, el segundo parcial, el 25%, las tareas el 30% y el
Examen Final el 25% de la nota final. Si un estudiante tiene las calificaciones 1er. P: 30;
2º.P: 58; tareas: 80 y EF: 64, ¿Cuál es la media aritmética ponderada (nota final)
2. Supongamos que en un almacén tienen empleados a 12 vendedores, y sus ingresos
mensuales son: $ 585, $ 521, $ 656, $ 465, $ 536, $ 487, $ 564, $ 490, $ 563, $ 1234, $
469 y $ 547. Se pide determinar la media de los ingresos de los vendedores.

Lic. Rafael N. Pacheco García 25


Estadística Descriptiva

EJERCICIOS PROPUESTOS:
1) Hallar las medias (Aritmética, Ponderada, Armónica y Geométrica), mediana y moda
a) Las calificaciones de un estudiante en 6 pruebas fueron 84, 91, 72, 68, 87 y 78
b) Diez medidas del diámetro de un cilindro fueron registradas como 3.88, 4.09, 3.92,
3.97, 4.02, 3.95, 4.03, 3.92, 3.98, 4.06
c) Los salarios anuales en US $ de 4 trabajadores fueron 5000, 6000, 6500, 30000
d) 3, 5, 2, 6, 5, 9, 2, 8
e) 51.6, 48.7, 50.3, 49.5, 48.9
f) 3, 5, 6, 6, 7, 10, 12
2) De un total de 100 números, 20 eran 4, 40 eran 5, 30 eran 6 y el resto eran 7, hallar la
media de los números.
3) Las puntuaciones finales de un estudiante en Matemáticas, Física, Contabilidad e Inglés
son, respectivamente 82, 86, 90 y 70. Si la importancia que se asigna a estas
asignaturas son de 3, 5, 3 y 1, respectivamente, calcular el promedio de puntuación
adecuado.
4) Cuatro grupos de estudiantes formados por 15, 20, 10 y 18 individuos registran una
media de pesos de 162, 148, 153, 140 libras, respectivamente, hallar el peso medio de
todos los estudiantes.
5) Los 90 empleados de la sucursal A de una Empresa ganan en promedio $ 230.000, y
los 75 empleados de la sucursal B ganan en promedio $ 325.000. ¿Cuál es el promedio
de sueldos de las dos sucursales?
6) Los salarios en US $ por horas de cinco empleados de una oficina son 2.52, 3.96, 3.28,
9.20 y 3.75, hallar la mediana y la media del salario horario.
7) Una guardería es una institución elegible para recibir un subsidio destinado a los
servicios sociales de la alcaldía municipal, a condición que la edad promedio de sus
niños no llegue a 9 años. Las edades de los niños inscritos en ella son: 8, 5, 9, 10, 9,
12, 7, 12, 13, 7, 8.
a) ¿Llena el requisito para recibir el subsidio?
La guardería puede continuar recibiendo subsidio si el ingreso anual promedio de la
familia que asisten a esa institución no llegue a US$ 12,500.00. Los ingresos familiares
de los padres de los niños es 8,800 - 14,500 - 15,600 - 12,500 - 8.000 - 7,800 - 6,500 -
5,900 - 10,200 - 14,300 - 13,900
b) ¿Llena la institución los requisitos para recibir apoyo financiero de la Junta
Comunal dela alcaldía?
Si su respuesta es:
i) Negativa, ¿cuánto debe disminuir el ingreso familiar para cumplir esa
condición?
ii) Afirmativa, ¿cuánto puede aumentar el ingreso familiar promedio, sin que la
institución pierda su elegibilidad para recibir el subsidio?
8) La siguiente distribución corresponde a salarios mensuales de un grupo de 56
personas.

Lic. Rafael N. Pacheco García 27


Estadística Descriptiva

Tema 4: Medidas de Variación

Son aquellas que nos proporcionan que tan dispersos se encuentran los datos con
respecto su Media aritmética:
1. Amplitud o Rango
2. Varianza
3. Desviación Estándar o Típica

1. Definición y Calculo de Amplitud o Rango


Se define como la diferencia absoluta existente entre el valor mayor y el menor valor de
una serie de datos, se denota con R.

2. Definición y Calculo de Varianza o Variancia

La desviación es la diferencia observada entre cada valor de una serie de datos y su


correspondiente media.

La Varianza: Es la media de los cuadrados de las desviaciones y se denota con S2 cuando


se refiera a una muestra de una población.
∑ ( )
Su fórmula es =
Es poco significativo, por medir al cuadrado las unidades de la variable.

Para datos agrupados utilizamos la formula = − ̅ donde xi es el punto medio de
cada intervalo.

3. Definición y Calculo de Desviación Estándar


Se define como la raíz cuadrada de la varianza y se denota por S.
Todas las medidas de dispersión vienen influidas por la unidad en que se mide la variable
en estudio, si estas se cambian los valores de los estadísticos se ven a su vez modificados.

4. Ejercicios de Medidas de Variación:

Calcular Rango, Media aritmética, Varianza y Desviación Estándar en:


1. Nota final de 5 estudiantes: 85, 78, 94, 82, 95
2. Edades en años de niños de un preescolar es 8, 5, 9, 10, 9, 12, 7, 12, 13, 7, 8
3. Salario promedio anual en córdobas 14,500, 15,600, 12,500, 8,000, 7,800, 6,500,
5,900, 10,200, 8,800, 14,300, 13,900

Lic. Rafael N. Pacheco García 31

Potrebbero piacerti anche