Sei sulla pagina 1di 53

Instituto Profesional Valle Central

Sede Concepción

ESTADISTICA DESCRIPTIVA

CRISTIAN BARRIOS A
¿Qué es una Distribución de Frecuencia?

La distribución de frecuencia es una disposición


de tabulación de datos estadísticos, ordenados
ascendente o descentemente, de acuerdo a la
frecuencia de cada dato.

En pocas palabras resume la información


acerca de la cantidad de veces que una
variable toma un valor determinado,
permitiendo a su vez organizar e
interpretar de manera más rápido y
eficiente.
Ejemplo
Para entender como funcionan las tablas de frecuencia, analicemos el siguiente
ejemplo:

Una persona lanza una moneda 10 veces, y registra si el lado superior cae en cara (C) o
sello (S). Los resultados del experimento se muestran a continuación:

C S S C C S S C S C

La forma de simplificar los datos anteriores equivale a contar cuantas veces se repite
cada lado de la moneda.
El lado cara se repitió 5 veces y el lado sello 5 veces. Nótese que la suma de las
frecuencias equivale al total de lanzamientos.

LADO FRECUENCIA ( f )
CARA ( C ) 5
SELLO ( S ) 5
Escalas de Medición de las Variables

Las escalas de medición son el conjunto de los posibles valores que


determinada variable puede tomar.

Al elaborar estadísticas con datos y su característica es necesario


contarlas, jerarquizarlas y medirlas, es por ello que, se utilizan las
escalas de medición como el proceso de asignar números o establecer
una correspondencia uno a uno entre objetivos y observaciones
Medición de
variables

Razón o
Nominal Ordinal Intervalos
Proporción
Escala Nominal

Consiste en clasificar a los elementos, personas, animales, etc.


asignándoles símbolos o nombres. Los datos que se obtienen para una
variable cualitativa se miden en una escala nominal y simplemente se
clasifican en distintas categorías que no implican orden. La escala
nominal es la forma más débil de medición porque no se puede aplicar
operaciones aritméticas ni intentar el conteo de las diferencias dentro de
una categoría determinada o especificar cualquier orden o dirección a lo
largo de las diversas categorías.
Propiedades de la Escala Nominal

 No intervienen mediciones, ni escala, en vez de esto solo


hay cuentas o conteos.

 No existe un orden específico para esta categoría.

 No presentan el cero.

 No se basa en diferencia cuantitativa


Por ejemplo …
Una muestra de personas de una población determinada puede clasificarse en
base la religión que profesan. La clasificación que se le puede dar a los datos es
la siguientes:

(1) Cristianos
(2) Judíos
(3) Musulmanes
(4) Otros
(5) Sin Creencia alguna

bien podrían clasificarse según el sexo, el color de los ojos, algún partido
político, etcétera. Otros ejemplos de escala nominal puede ser el numero de
placa de los vehículos, los números de los teléfonos de una ciudad, la Cedula de
Identidad de los habitantes de un país, etc.
Escala Ordinal
Establece una relación de orden entre los elementos (personas, animales,
objetos, etc.), en atención a una característica, sin que reflejen distancia entre
ellos. La diferencia entre dos números ordinales no tiene significado
cuantitativo, sólo expresan, por ejemplo, que una situación es mejor que otra,
pero no dice cuanto es uno que el otro. La escala ordinal sigue siendo una
forma de medición débil porque no se pueden hacer planteamientos numéricos
significativos con respecto a las diferencias entre las categorías. Es decir, la
ordenación establece sólo cuál categoría es “mayor”, “mejor” o “preferida”; y no
se habla cuánto es “mayor”, “mejor” o más “preferida”.
Propiedades Escala Ordinal

 Las observaciones o elementos se les ordena en rangos o categorías


diferentes.

 Las categorías son mayores o menores que otras categorías, es decir, que
existe una clasificación de mayor a menor (jerarquía).

 Las categorías son mutuamente excluyentes y exhaustivas.

 No presentan el cero.
Por ejemplo …
Se pueden clasificar los habitantes de una ciudad de acuerdo a su situación
económica, a los estudiantes tomando en cuenta a su rendimiento académico, el
orden jerárquico de los militares (Subteniente, Teniente, Capitán, Mayor,
Teniente Coronel, Coronel, General) y la clasificación académica de los
profesores universitarios (Instructor, Asistente, Agregado, Asociado, Titular), etc.
Escala de medición de intervalos
La medición de intervalos, tiene todas las características de una escala ordinal,
además permite conocer la distancia entre dos números cualquiera. Esta escala
se caracteriza por tener una unidad de medida y un origen (cero) arbitrario. La
escala de intervalos a diferencia de la nominal y ordinal, es una escala
efectivamente cuantitativamente. Una escala de intervalo es una escala
ordenada, en la cual la diferencia entre las mediciones es una cantidad
significativa.

La escala de intervalos posee además, de las características de la escala nominal


y ordinal, la propiedad de que la distancia entre dos valores es de una magnitud
conocida, lo que le permite a esta escala un mayor grado de perfección, ya que
proporciona números que manifiestan diferencias palpables entre individuos,
objetos o cosas.
Propiedades de la escala de Intervalo

 Esta escala implica la cuantificación de los datos


 En estás medidas se utilizan unidades constantes de medición (capacidad,
peso, Céntimos, grados Fahrenheit o centígrados) los cuales producen
intervalos iguales entre puntos de la escala.
 Proporcionan números que manifiestan diferencias palpables entre individuos,
objetos o cosas.
 En esta escala de intervalos el punto cero (0) y la unidad de medida es
arbitrario.
 Se pueden aplicar todas las medidas estadísticas más conocidas, con
excepción del coeficiente de variación.
 Son mutuamente exclusivas y exhaustivas.
Por ejemplo …
Dentro de los ejemplos de este tipo de medición, están las escala utilizadas para
medir temperatura, bien sea en grados Centígrados o Fahrenheit. En estas
escalas la diferencia entre 80º y 85º es igual a la que existe entre 90º y 95º o
entre dos puntos cualesquiera de la escala, etc.
Escala de Medición de Razón o Proporción

Esta constituye el nivel más alto de medición, posee todas las


características de las escalas nominales, ordinales y de intervalos;
además tiene un cero absoluto o natural que tiene significado físico. Si
en ella la medición es cero, significa ausencia o inexistencia total de la
propiedad considerada. Son posibles todas las operaciones aritméticas.
Los números indican los valores concretos de la propiedad que sé esta
midiendo; peso, estatura, ingresos monetarios y gastos directos, son
ejemplos de medidas con una escala de razón.
Propiedades de la escala a razón

 La distancia entre los números es un tamaño conocido y constante.

 Los datos tienen un punto cero significativo.

 Puede utilizarse cualquier prueba de tipo estadístico, incluyendo el


coeficiente de variación.

 Permite hacer comparaciones entre los números verdaderos con un cero


aritmético siendo arbitrario únicamente la unidad de medida.
Por ejemplo …
Dentro de los ejemplos de la medición de razón, se encuentra la medición del
peso o altura de un grupo de personas, el ingreso familiar, la intensidad de
corriente eléctrica de un cable, la edad de un grupo de personas, etc.
Distribuciones de Frecuencias

Distribuciones
de
frecuencias

Frecuencia
Frecuencia Frecuencia Frecuencia
Rel.
Absoluta Acumulada Relativa
Acumulada
Frecuencia Absoluta (fi)

La frecuencia Absoluta es el número de veces que se repite un determinado


valor de la variable (Xi ), esta se encuentra designada por la simbología (fi),

en donde i= 1, 2, 3, … , ∞

PROPIEDAD: la suma de todas las frecuencias absolutas es igual al total de


observaciones (n).
Frecuencia Acumulada (Fi)
Las frecuencias acumuladas, son aquellas que se obtienen de las sumas sucesivas
de las fi que integran cada una de las filas de una distribución de frecuencia,
esto se logra cuando la acumulación de las frecuencias se realiza tomando en
cuenta la primera fila hasta alcanzar la ultima. Las frecuencias acumuladas se
designan con las letras Fi

PROPIEDAD: La última frecuencia acumulada absoluta es igual al total de


observaciones.
Frecuencia Relativa (hi)
La Frecuencia Relativa, es aquella que resulta de dividir cada una de las
frecuencias absolutas entre el número total de datos. Las frecuencias relativas se
denominan con la letra hi.

PROPIEDAD: La suma de todas las frecuencias relativas es igual a la unidad.


Frecuencia Relativa Acumulada (Hi)
La frecuencia Relativa Acumulada, es aquella que resulta de
dividir cada una de las frecuencias acumuladas entre número
total de datos, la cual se encuentra denominada por la letra
(Hi).

PROPIEDAD: La última frecuencia relativa acumulada es la


unidad.
La distribución de frecuencia es la representación estructurada en forma de
tabla de toda la información que se ha recogido sobre la variable que se estudia,
es decir, es una tabla que presenta de manera ordenada los distintos valores de
una variable y sus correspondientes frecuencias. Su forma mas común es la
siguiente:
Ejemplo …
El gobierno desea averiguar si el número medio de hijos por familia ha
descendido respecto de la década anterior. Para ello ha encuestado a 50
familias respecto al número de hijos, y ha obtenido los siguientes datos:

0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3
3 3 3 3 4 4 4 4 4 4 5 6

1) Construir la tabla de frecuencias absolutas


2) ¿Cuál es el número de familias que tiene como máximo dos hijos?
3) ¿Cuántas familias tienen más de 1 hijo pero como máximo 3?
4) ¿Qué porcentaje de familias tiene más de 3 hijos?
Solución
Para construir la tabla de frecuencias hay que tener en cuenta que la variable en
estudio es el número de hijos (discreta), que toma los valores existentes entre 0 y 6
hijos y las frecuencias son el conjunto de familias, de esta forma tenemos:

 b. En la columna de las fi: 2+4+21=27 ó en la columna de las Fi: F2= 27


 c. En la columna de las fi: 21+15=36 ó en la columna de las Fi: 42-6=36
 d. En la columna de las hj: 0.12+0.02+0.02=0.16, que supone un 16% ó en la
columna de las Hi: 1-0.84=0.16, 16%
Distribuciones De Frecuencias Agrupadas
Es aquella distribución en la que la disposición tabular de los datos estadísticos
se encuentran ordenados en clases y con la frecuencia en cada clase; es decir, los
datos originales de varios valores adyacentes del conjunto se combinan para
formar un intervalo de clase.

No existen normas establecidas para determinar cuándo es apropiado utilizar


datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el
número total de datos (N) es igual o superior 50 y además el rango o recorrido de
la serie de datos es mayor de 20, entonces, se utilizará la distribución de
frecuencia para datos agrupados, también se utilizará este tipo de distribución
cuando se requiera elaborar gráficos lineales como el histograma, el polígono de
frecuencia o la ojiva.
Para agrupar los datos en intervalos de clase se deben seguir las siguientes reglas
generales:

a) El numero de intervalos de clase se toma entre 5 y 15 dependiendo de los


datos.

b) Cada observación debe estar incluida en una y solo una clase o intervalo.

c) El valor mas pequeño y mas grande deben entrar en la clasificación.

d) No deben existir brechas o vacíos entre clases sucesivas.

e) Los intervalos no se deben sobreponer.

f) En la medida de lo posible, se debe utilizar la misma amplitud para todos los


intervalos.
Conceptos claves …
Clase o Intervalo de clase: Son divisiones o categorías en las
cuales se agrupan un conjunto de datos ordenados con
características comunes. Para organizar los valores de la
serie de datos hay que determinar un número de clases que
sea conveniente.

A las fronteras del intervalo, la llamaremos, límites inferior


y superior de la clase y los denotaremos por Li-1, Li.
Punto medio o Marca de clase (X°) :Es la semisuma del límite inferior y superior
de una clase, tal como lo indica la siguiente formula:

Amplitud , Longitud o Tamaño del Intervalo: Los intervalos de clases pueden ser
de tres tipos: Clases de igual tamaño, clases de tamaños desiguales y clases
abiertas. En términos generales, las clases de igual tamaño son los mas utilizados
y recomendados para los cálculos estadísticos, las cuales se denominan bajo la
letra Ic.
Procedimiento para construir una distribución
de frecuencia agrupada en intervalos
1. Determinar el máximo y mínimo entre los valores que tenemos en la muestra y calcular el
recorrido de la variable o rango.

2. Calcular el número de clases a utilizar. Existen diversos criterios para determinar el numero
de clases, ante tanta diversidad de criterios, se ha considerado que lo mas importante es
dar un ancho o longitud de clases a todos los intervalos de tal manera que respondan a la
naturaleza de los datos y al objetivo que se persigue y esto se logra con la practica. Existe
una forma para determinar el numero de clases como se aprecia en el cuadro:
Cuando se tenga dudas en determinar el numero de intervalos de clases, es de
gran utilidad utilizar el método sugerido por Hebert A. Sturges, el cual establece
que: K= 1+3,322 log(n) = numero de intervalos. En este curso se utilizará este
método siempre y cuando el mismo sea aplicable.

3. Determinamos la amplitud o tamaño de los intervalos través de la siguiente


formula:
Ejemplo …
Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de
sus habitaciones, el gerente investiga los precios por habitación de 40 hoteles de la
misma categoría de esta ciudad. Los datos obtenidos (en miles de pesetas) fueron:

 3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1


4.2 4.2 4.3 4.3 4.3 4.3 4.4 4.4 4.5
4.5 4.5 4.5 4.7 4.7 4.7 4.7 4.8 4.9
5.0 5.0 5.1 5.1 5.3 5.3 5.4 5.6 5.8
5.8 6.0 6.1 6.1

1. Realice una tabla de frecuencia


2. ¿Cuantos hoteles tienen un precio entre 3.3 y 3.8?
3. ¿Cuantos hoteles tienen un precio superior a 4.8?
4. ¿Que porcentaje de hoteles cuestan como mucho 4.3?
Solución
Procedimiento:
 El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8.
 K= 1+3,322 log(40) = 6.3 aprox. 6 números de intervalos
 Ic = 2.8 / 6 = 0.467 aprox. 0.5 tamaño de los intervalos
Así pues la tabla sería:

 3
 15
 27.5 %