Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
LA MEDIA ARITMÉTICA
La media aritmética o simplemente media, o promedio, es el más conocido y quizás el más usado
de los parámetros de posición por las ventajas que ofrece en algunos aspectos. Se denota con x,
(léase “x barra”) y para un conjunto n de valores de la variable x 1; x2; x3…; xn se define por:
Es decir, la media aritmética simple es la sumatoria de los valores de la variable xi, (variando i
desde 1 hasta n), dividido por el total “n” de observaciones.
Si los valores de la x1; x2; x3; …xk se repiten diferente número de veces, o sea tienen frecuencias
diferentes, (simbolizadas por fi), podemos agruparlos en una tabla simple de distribución de
frecuencias (variable cuantitativa discreta). Es necesario tener en cuenta el diferente peso que los
datos tienen en la distribución y en éste caso deberá aplicarse el concepto de media aritmética
ponderada.
Donde n es la frecuencia total (o sea el número total de casos, que en la tabla de distribución de
frecuencias está dado por la sumatoria de las fi).
xi se calcula como el promedio entre los extremos de cada intervalo, Xi representa el punto medio
o marca de clase, de cada intervalo de clase.
CARACTERÍSTICAS DE LA MEDIA ARITMÉTICA:
En general, entendemos por desvío, a la diferencia entre los valores de la variable y un valor fijo
cualquiera. Cuando ese valor fijo es la media aritmética tendremos desvíos con respecto a ella.
Propiedad 5: “La suma de los cuadrados de los desvíos con respecto a la media aritmética, da un
mínimo”.
Es decir que cuando los desvíos son con respecto a la media, la suma de los cuadrados nos da un
valor que será siempre menor que el valor que se obtiene cuando los desvíos y sus cuadrados se
calculan respecto de cualquier otra constante distinta a la media.
MODO O MODA
Es el valor de la variable que se repite la mayor cantidad de veces, o sea, al que le corresponde la
máxima frecuencia.
Si tenemos datos sin agrupar, bastará con identificar cuál es el valor de la variable que más se
repite. Podremos tener series, con un modo, con más de un modo, o sea bimodales, o que no
tengan modo, llamadas amodales.
En el caso de pocos datos provenientes de una variable discreta, una vez agrupados es posible
determinar inmediatamente el valor modal. Bastará con identificar al valor de la variable al que le
corresponde la mayor frecuencia.
PARA VARIABLE CUANTITATIVA CONTINUA
En una tabla con intervalos de clase el modo se puede obtener gráfica y analíticamente.
Determinación analítica:
DETERMINACIÓN GRÁFICA:
adyacentes.
b) Se trazan dos diagonales en el interior de la barra del intervalo modal, partiendo de los vértices
de la barra hasta los vértices de las adyacentes.
c) Se traza luego una línea perpendicular desde la intersección de las dos diagonales hasta el eje
de las x, (escala horizontal). El punto donde se cortan será el valor de la variable al que le
corresponde la máxima frecuencia, o sea el modo.
Para variables cualitativas: Si la variable de estudio es de éste tipo, la única medida de tendencia
central que se puede calcular es el modo o moda.
MEDIANA
Si la cantidad de datos es impar: La observación central será aquella que ocupe el lugar
Si la cantidad de datos es par: La mediana se calcula convencionalmente como el punto medio
(valor promedio) entre los valores que ocupan el lugar: N/2 Y (N/2) +1
El procedimiento de cálculo resulta de practicar el análisis anterior para serie simple, pero
teniendo en cuenta las ponderaciones que ahora aparecen. Las reglas para el cálculo de la
mediana son las siguientes:
DETERMINACIÓN GRÁFICA:
a) Se confecciona el histograma con las frecuencias acumuladas.
b) Se traza la ojiva.
c) Con el valor n/2 lo ubico sobre el eje de las ordenadas, y trazo una recta paralela al eje x hasta
que corte a la ojiva.
d) Se traza luego una línea perpendicular desde la intersección con la ojiva hasta el eje de las x,
(escala horizontal). El punto donde se cortan será el valor de la variable al que le corresponde la
mediana.
CUARTILES
DECILES:
PERCENTILES:
Permiten el estudio, aún más detallado de la distribución, ya que el análisis se hace por tramos del
1%.
El mínimo, el cuartil inferior, la mediana, el cuartil superior y el máximo son cinco números. Dan
una idea de cómo está distribuido un conjunto de datos. Se los llama los cinco números resumen y
se los representa por: Mínimo C1 M C3 Máximo El 50% de los datos se encuentran entre el cuartil
inferior y el superior.
Los cinco números resumen de los pesos de los alumnos de 4to. año son: Mínimo C1 M C3
Máximo
37 51 58 67 85
MEDIDAS DE DISPERSIÓN
R = XMax - Xmin
Es la más sencilla, pero también suele ser la más imperfecta de las medidas. Es completamente
dependiente de los dos valores extremos que toma la variable.
DESVIACIÓN MEDIA
Se la define como la sumatoria del valor absoluto de las desviaciones de los valores de la variable,
con respecto a la media aritmética. No se usa con mucha frecuencia, porque al usar valores
absolutos no es fácil de manipular algebraicamente.
datos agrupados
La desviación media mide el promedio de las diferencias entre los valores observados respecto a la
media del grupo, sin tener en cuenta el signo de la desviación. A diferencia del rango, la desviación
media toma en cuenta todas las observaciones en una distribución.
DESVIACIÓN MEDIANA
Las desviaciones son definidas ahora, como diferencias entre las observaciones y la mediana.
Dos medidas de dispersión que tienen en cuenta cómo se distribuyen todas las observaciones de
los datos, son la varianza y su raíz cuadrada, la desviación estándar.
La varianza es la suma de las desviaciones con respecto a la media aritmética elevadas al cuadrado
dividida por el número de observaciones.
DESVÍO ESTÁNDAR
EL desvío estándar es una medida de dispersión basada en la media y utiliza todos los datos.
Durante muchos años la media y el desvío estándar fueron, y tal vez sigan siendo, las medidas
resumen más utilizadas. El desvío estándar de los datos de toda una población (desvío estándar
poblacional) se denota con la letra griega (sigma minúscula). Pero la mayoría de las veces los
parámetros poblacionales son desconocidos. ¿Qué se hace? Se calcula un estimador (s, desvío
estándar muestral) utilizando una muestra.
El desvío estándar se calcula promediando la diferencia entre cada dato y la media, elevadas al
cuadrado. Como este resultado tiene las unidades al cuadrado, luego se saca la raíz cuadrada.
Un valor de éste parámetro más alto que otro, para una misma variable, indica mayor dispersión y
viceversa.
Puesto que tanto la desviación estándar como la media se miden en las unidades
originales, el CV es una medida independiente de las unidades de medición.
Debido a la propiedad anterior el CV es la cantidad más adecuada para comparar la
variabilidad de dos conjuntos de datos.
Además el coeficiente de variación es útil también al comparar dos o más conjuntos de datos,
(distribuciones), que se miden en las mismas unidades de medida pero difieren a un grado tal que
las comparaciones directas de las respectivas desviaciones estándar no es muy útil.