Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Descripción de datos
Datos agrupados y datos no agrupados
Cuando la muestra que se ha tomado de la población o proceso que se desea
analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos
datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que
se le llama tratamiento de datos no agrupados.
Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos
en clases y a partir de estas determinar las características de la muestra y por
consiguiente las de la población de donde fue tomada. Antes de pasar a definir cuál
es la manera de determinar las características de interés (media, mediana, moda,
etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que
sepamos cómo se agrupan los datos.
Frecuencia de clase
Marca de clase (punto medio): punto que divide a la clase en dos partes iguales. Es
el promedio entre los límites superior e inferior de la clase.
Intervalo de clase: para una distribución de frecuencias que tiene clases del mismo
tamaño, el intervalo de clase se obtiene restando el límite inferior de una clase del
límite inferior de la siguiente.
Frecuencia Relativa
Es la relación o cociente entre la frecuencia absoluta y el número total de
observaciones. Es la proporción entre la frecuencia de un intervalo y el número total
de datos.
Punto Medio
Punto medio es el punto que divide a un segmento en dos partes iguales.
El punto medio de un segmento, es único y equidista de los extremos del segmento.
Cumpliendo esta última condición, pertenece a la mediatriz del segmento.
La fórmula para determinar el punto medio de un segmento en el plano, con
coordenadas: (x1,y1) y (x2,y2) es: [(x1 + x2) / 2] + [(y1 + y2) / 2]
Límites
Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre
los cuales van a estar los valores de los datos agrupados en ese intervalo de clase.
Medidas de tendencia central
Media aritmética
La medida de tendencia central más obvia que se puede elegir, es el simple
promedio de las observaciones del grupo, es decir el valor obtenido sumando las
observaciones y dividiendo esta suma por el número de observaciones que hay en
el grupo.
La media aritmética se puede expresar como:
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
xi fi xi · fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1,820
Media geométrica
La media geométrica de un conjunto de observaciones es la raíz n-ésima de su
producto.
El cálculo de la media geométrica exige que todas las observaciones sean positivas.
Se puede expresar como:
Ejemplo
En una empresa quieren saber la proporción media de mujeres en los diferentes
departamentos. Para ello, se recoge el porcentaje de mujeres en los cinco
principales departamentos.
Como es la media de porcentajes, calculamos la media geométrica que es más
representativa.
Media ponderada
La media o promedio simple es la medida de tendencia central más utilizada; sin
embargo, cuando algunos de los valores por promediar son más importantes que
otros, por ejemplo, al evaluar a un empleado, su calificación en conocimientos,
puntualidad, presentación y otros conceptos tiene una importancia relativa diferente
en función a quién, hace la evolución.
Tal vez no sea lo mismo un empleado con 10 en conocimientos, 10 en puntualidad
y 7 en presentación (promedio = 9), que otro con 10 en conocimientos, 7 en
puntualidad y 10 en presentación (promedio = 9).
Cuando los valores por promediar tienen diferentes grados de importancia entre sí,
debe utilizarse el promedio ponderado, el cual aplica un factor de ponderación (o
importancia relativa) a cada uno de los valores que se van a promediar.
Ejemplo
La nota final de una asignatura es una media ponderada de las notas que han
obtenido los alumnos en los cuatro elementos evaluables que determina el profesor.
El responsable de la asignatura otorga un peso de 3 al examen inicial, de 1 al trabajo
entregable, 2 al trabajo final y 4 al examen final. Las notas de un alumno han sido
las siguientes:
Se hace la suma de los productos de las notas por el peso de cada nota y se divide
por la suma de los pesos.
Mediana
La mediana es una medida de posición que divide a la serie de valores en dos partes
iguales, un cincuenta por ciento que es mayor o igual a esta y otro cincuenta por
ciento que es menor o igual que ella. Es, por lo tanto, un parámetro que está en el
medio del ordenamiento o arreglo de los datos organizados, entonces, la mediana
divide la distribución en una forma tal que a cada lado de la misma queda un número
igual de datos.
Para encontrar la mediana en una serie de datos no agrupados, lo primero que se
hace es ordenar los datos en una forma creciente o decreciente y luego se ubica la
posición que esta ocupa en esa serie de datos; para ello hay que determinar si la
serie de datos es par o impar, luego el número que se obtiene indica el lugar o
posición que ocupa la mediana en la serie de valores, luego la mediana será el
número que ocupe el lugar de lo posición encontrada.
Ejemplo
Hallar la mediana de las siguientes series de números:
3, 5 , 2, 6, 5 , 9, 5, 2 , 8 .
2, 2 , 3, 5, 5 , 5, 6, 8 , 9 .
Me = 5
3, 5 , 2, 6, 5 , 9, 5, 2 , 8 , 6.
2, 2 , 3, 5, 5 , 5, 6, 6 , 8 , 9.
10 / 2 = 5
Moda
La moda es la medida de posición que indica la magnitud del valor que se presenta
con más frecuencia en una serie de datos; es pues, el valor de la variable que más
se repite en un conjunto de datos. De las medias de posición la moda es la que se
determina con mayor facilidad, ya que se puede obtener por una simple observación
de los datos en estudio, puesto que la moda es el dato que se observa con mayor
frecuencia. La moda se designa con las letras Mo.
Ejemplo
Calcular la moda de la siguiente serie de números: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3,
4, 5, 4, 8, 2, 5, 4.
Mo = 5
Desviación estándar
La desviación estándar mide el grado de disersión de los datos con respecto a la
media, se denota como s para una muestra o como σ para la población. Se define
como la raiz cuadrada de la varianza según la expresión:
Desviación media
Es la media aritmética de los valores absolutos de las diferencias de cada dato
respecto a la media.
Donde:
xi : valores de la variable.
n: número total de datos
Desviación mediana
El criterio que guía esta estadística, radica en el uso de diferencias de cada dato
respecto a la mediana muestral m.
Si estas diferencias son muy grandes, entonces estamos ante un caso de gran
variabilidad, y si son pequeñas se espera que la variabilidad sea pequeña.
Naturalmente que el criterio que parece más apropiado es agrupar las discrepancias
individuales y tratarlas en conjunto.
Un agrupamiento natural sería una suma de ellas, pero el sólo uso de las diferencias
no garantiza que se pueda medir discrepancias porque algunas (prácticamente la
mitad) serán menores que la mediana, con diferencias negativas, y el resto mayores
que la mediana, con diferencias positivas, y al sumar dichos valores habría
compensaciones entre valores negativos y positivos.
Por lo tanto, una salida a esta dificultad es considerar el valor absoluto de las
diferencias calculadas y promediarlos.
Esto conduce a la definición siguiente:
Dado un conjunto de datos, x1, ..., xn su desviación mediana d.m., está definida por
Puede verse entonces que, cuanto mayor sea la dispersión existente entre los
datos, tanto mayor tenderá a ser el promedio del valor absoluto de las diferencias
de los datos, respecto de la mediana muestral.
Esta estadística se encuentra medida en la misma escala que los datos originales,
lo que facilita su comprensión.
Rango
Indica la dispersión entre los valores extremos de una variable. se calcula como la
diferencia entre el mayor y el menor valor de la variable. Se denota como R.
Para datos ordenados se calcula como:
R = x(n) - x(1)
Donde: x(n): Es el mayor valor de la variable. x(1): Es el menor valor de la variable.