Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
UNICOC
NEGOCIOS INTERNACIONALES
PROGRAMA: ESTADISTICA
CHIA – CUNDINAMARCA
2014
1. La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre
el número total de datos.
Ejemplo:
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la
tabla. Calcula la puntuación media.
xi fi xi · fi
[10, 20) 15 1 15
[30,40) 35 10 350
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1 820
(1)
2. Tabla de frecuencias
Las Tablas de frecuencias son herramientas de Estadística donde se colocan los datos en columnas
representando los distintos valores recogidos en la muestra y las frecuencias (las veces) en que
ocurren.
Datos
La frecuencia absoluta (ni) es el número de veces que aparece un determinado valor en un estudio
estadístico. Número de veces que se repite el í-esimo valor de la variable. La suma de las frecuencias
absolutas es igual al número total de datos, que se representa por n
La Frecuencia absoluta acumulada (Ni) es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado.
N1 = n1
N2 = n1 + n2 = N1 + n2
N3 = n1 + n2 + n3 = N2 + n3
Nk = n.
fi = ni/n
2.5 La frecuencia relativa acumulada (Fi) es el número de observaciones menores o iguales al í-esimo
valor de la variable pero en forma relativa.
F1 = fl
F2 = f1+ f2 = F1 + f2
F3 = f1+ f2 + f3 = F2 + f3
Fk = 1
Los datos no agrupados son las de observaciones realizadas en un estudio estadístico que se
presentan en su forma original tal y como fueron recolectados, para obtener información
directamente de ellos.
La Tabla de frecuencia de datos no agrupados indica las frecuencias con que aparecen los datos
estadísticos sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En
estas distribuciones cada dato mantiene su propia identidad después que la distribución de
frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente
reagrupados, siguiendo un orden lógico con sus respectivas frecuencias.
La tabla de frecuencias de datos no agrupados se emplea si las variables toman un número pequeños
de valores o la variable es discreta.
La Tabla de frecuencia de datos agrupados aquella distribución en la que los datos estadísticos
se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales
de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.
La tabla de frecuencias agrupadas se emplea generalmente si las variables toman un número grande
de valores o la variable es continua.
En este caso se agrupan los valores en intervalos que tengan la misma amplitud denominados clases.
A cada clase se le asigna su frecuencia correspondiente.
Las clases deben ser excluyentes y exhaustivas, es decir que cada elemento de la muestra debe
pertenecer a una sola clase y a su vez, todo elemento debe pertenecer a alguna clase.
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
Los intervalos se forman teniendo presente que el límite inferior de una clase pertenece al intervalo,
pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo. No existe una
regla fija de cuantos son los intervalos que se deben hacer; hay diferentes criterios, la literatura
especializada recomienda considerar entre 5 y 20 intervalos. El número de intervalos se representa
por la letra "K".
El Recorrido es el límite dentro del cual están comprendidos todos los valores de la serie de datos,.
Es la diferencia entre el valor máximo de una variable y el valor mínimo que ésta toma en una
investigación cualquiera.
R = Xmax. - Xmin.
La Amplitud de la clase es la diferencia entre el límite superior e inferior de la clase y se
representarán por "Ci"
Ci = R/K
La Marcas de clases (Xi) representa a la variable a través de un valor. Se calcula como el punto medio
de cada clase, o bien la semi suma de la clase
3. Las medidas de variabilidad nos informan sobre el grado de concentración o dispersión que
presentan los datos respecto a su promedio. Llamaremos homogénea, concentrada o poco dispersa
a aquella distribución en la que todos los datos están cercanos al centro, como 4 4 5 5 5 5 6 6 6 6 7,
y heterogénea o dispersa a la distribución con datos más separados del centro, como 1 3 5 8 10 16
20.
3.1 RANGO
También llamado Recorrido o Amplitud total, es la diferencia entre el máximo valor del conjunto de
datos y el mínimo de ellos. A mayor rango, mayor dispersión.
A veces se usa el Rango verdadero que consiste en considerar cada dato rodeado de una unidad,
por efecto de los redondeos, con lo que en el ejemplo anterior el mínimo sería 2,5 y el máximo 9,5.
Con ello el rango se convertiría en 7.
No es una medida buena, pues ignora todo lo que ocurre dentro de ese rango.
3.3 VARIANZA
Es propia de las medidas de intervalo o razón. Su inconveniente es que no usa la misma unidad que
los datos, sino su cuadrado.
Como en la varianza, para datos aislados basta con suprimir las frecuencias ni.
La desviación típica s es base de muchas técnicas, al igual que la media y la varianza. Su gran ventaja
es estar medida en las mismas unidades que los datos y la media, lo que permite establecer razones
y proporciones entre ellas.
La desviación típica cumple la llamada desigualdad de Tchebychev: según la cual, los datos que se
alejan de la media una distancia igual o menor que s, multiplicado por un coeficiente k suponen más
de la proporción 1-1/k2. Así, el 75% de los datos al menos, se encuentra a menos de dos desviaciones
típicas y el 89% a menos de tres. (3)
https://sites.google.com/site/estadisticadescriptivaenedu/home/unidad-1/medidas-de-
variabilidad
4. La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una
distribución estadística.
9, 3, 8, 8, 9, 8, 9, 18
xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
42 1 820 88 050
Propiedades de la varianza
1 La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se
puede calcular la varianza total.
1 La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
2 En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones
están elevadas al cuadrado. (4)
Bibliografía