Sei sulla pagina 1di 8

CONCEPTOS DE ESTADISTICA

(MEDIA, TABLA DE FRECUENCIA,


MEDIDAS DE VARIABILIDAD Y VARIABILIDAD)

YENNY LORENA CELY GIL

UNICOC
NEGOCIOS INTERNACIONALES
PROGRAMA: ESTADISTICA
CHIA – CUNDINAMARCA
2014
1. La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre
el número total de datos.

Es el símbolo de la media aritmética.

Ejemplo:

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

1.1 Media aritmética para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la
tabla. Calcula la puntuación media.

xi fi xi · fi

[10, 20) 15 1 15

[20, 30) 25 8 200

[30,40) 35 10 350

[40, 50) 45 9 405

[50, 60 55 8 440

[60,70) 65 4 260
[70, 80) 75 2 150

42 1 820

(1)

2. Tabla de frecuencias

Las Tablas de frecuencias son herramientas de Estadística donde se colocan los datos en columnas
representando los distintos valores recogidos en la muestra y las frecuencias (las veces) en que
ocurren.

Datos

Los datos son los valores de la muestra recogida en el estudio estadístico

2.2 Frecuencia absoluta

La frecuencia absoluta (ni) es el número de veces que aparece un determinado valor en un estudio
estadístico. Número de veces que se repite el í-esimo valor de la variable. La suma de las frecuencias
absolutas es igual al número total de datos, que se representa por n

2.3 Frecuencia absoluta acumulada

La Frecuencia absoluta acumulada (Ni) es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado.

N1 = n1

N2 = n1 + n2 = N1 + n2

N3 = n1 + n2 + n3 = N2 + n3

Nk = n.

Se interpreta como el número de observaciones menores o iguales al í-esimo valor de la variable.

2.4 Frecuencia relativa

La frecuencia relativa (fi) es la proporción de veces que se repite un determinado dato.

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el


número total de datos.

fi = ni/n

La suma de las frecuencias relativas es igual a 1.

Frecuencia relativa acumulada

2.5 La frecuencia relativa acumulada (Fi) es el número de observaciones menores o iguales al í-esimo
valor de la variable pero en forma relativa.
F1 = fl

F2 = f1+ f2 = F1 + f2

F3 = f1+ f2 + f3 = F2 + f3

Fk = 1

2.6 Tabla de frecuencia de datos no agrupados

Los datos no agrupados son las de observaciones realizadas en un estudio estadístico que se
presentan en su forma original tal y como fueron recolectados, para obtener información
directamente de ellos.

La Tabla de frecuencia de datos no agrupados indica las frecuencias con que aparecen los datos
estadísticos sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En
estas distribuciones cada dato mantiene su propia identidad después que la distribución de
frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente
reagrupados, siguiendo un orden lógico con sus respectivas frecuencias.

La tabla de frecuencias de datos no agrupados se emplea si las variables toman un número pequeños
de valores o la variable es discreta.

2.7 Tabla de frecuencia de datos agrupados

La Tabla de frecuencia de datos agrupados aquella distribución en la que los datos estadísticos
se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales
de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.

La tabla de frecuencias agrupadas se emplea generalmente si las variables toman un número grande
de valores o la variable es continua.

En este caso se agrupan los valores en intervalos que tengan la misma amplitud denominados clases.
A cada clase se le asigna su frecuencia correspondiente.

Las clases deben ser excluyentes y exhaustivas, es decir que cada elemento de la muestra debe
pertenecer a una sola clase y a su vez, todo elemento debe pertenecer a alguna clase.

Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

Los intervalos se forman teniendo presente que el límite inferior de una clase pertenece al intervalo,
pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo. No existe una
regla fija de cuantos son los intervalos que se deben hacer; hay diferentes criterios, la literatura
especializada recomienda considerar entre 5 y 20 intervalos. El número de intervalos se representa
por la letra "K".

El Recorrido es el límite dentro del cual están comprendidos todos los valores de la serie de datos,.
Es la diferencia entre el valor máximo de una variable y el valor mínimo que ésta toma en una
investigación cualquiera.

R = Xmax. - Xmin.
La Amplitud de la clase es la diferencia entre el límite superior e inferior de la clase y se
representarán por "Ci"

Ci = R/K

Se considerará la misma amplitud para todos los intervalos.

La Marcas de clases (Xi) representa a la variable a través de un valor. Se calcula como el punto medio
de cada clase, o bien la semi suma de la clase

La tabla de frecuencias puede representarse gráficamente en un histograma. Normalmente en el


eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores. (2)

3. Las medidas de variabilidad nos informan sobre el grado de concentración o dispersión que
presentan los datos respecto a su promedio. Llamaremos homogénea, concentrada o poco dispersa
a aquella distribución en la que todos los datos están cercanos al centro, como 4 4 5 5 5 5 6 6 6 6 7,
y heterogénea o dispersa a la distribución con datos más separados del centro, como 1 3 5 8 10 16
20.

Existen muchas formas de medir la variabilidad. Se Destacan las más importantes:

3.1 RANGO

También llamado Recorrido o Amplitud total, es la diferencia entre el máximo valor del conjunto de
datos y el mínimo de ellos. A mayor rango, mayor dispersión.

El rango del conjunto 4 6 4 7 8 6 5 3 4 7 7 9 6 5 es 6, la diferencia entre el máximo 9 y el mínimo 3.

A veces se usa el Rango verdadero que consiste en considerar cada dato rodeado de una unidad,
por efecto de los redondeos, con lo que en el ejemplo anterior el mínimo sería 2,5 y el máximo 9,5.
Con ello el rango se convertiría en 7.

No es una medida buena, pues ignora todo lo que ocurre dentro de ese rango.

3.2 DESVIACIÓN MEDIA

Es una medida de la dispersión consistente en la media aritmética de las desviaciones individuales


respecto a la media, tomadas en valor absoluto. También se usan desviaciones respecto a la
mediana.

3.3 VARIANZA

Es una medida muy sensible de la variabilidad y base de muchas técnicas estadísticas.

Junto con la media forma el conjunto más importante de medidas.

Es propia de las medidas de intervalo o razón. Su inconveniente es que no usa la misma unidad que
los datos, sino su cuadrado.

No se deben comparar varianzas en conjuntos de unidades muy distintas, como estatura e


inteligencia.
En teoría del muestreo se sustituye por la cuasi-varianza, de idéntica fórmula, pero con cociente N-
1 en lugar de N. En este caso no sería válida la segunda fórmula.

3.4 DESVIACIÓN TÍPICA

Es la raíz cuadrada de la anterior. Su objeto es conseguir medir la variabilidad en las mismas


unidades que los datos. Así, un conjunto medido en metros, tendrá la varianza medida en metros
cuadrados, pero la desviación típica en metros.

Como en la varianza, para datos aislados basta con suprimir las frecuencias ni.

La desviación típica s es base de muchas técnicas, al igual que la media y la varianza. Su gran ventaja
es estar medida en las mismas unidades que los datos y la media, lo que permite establecer razones
y proporciones entre ellas.

La desviación típica cumple la llamada desigualdad de Tchebychev: según la cual, los datos que se
alejan de la media una distancia igual o menor que s, multiplicado por un coeficiente k suponen más
de la proporción 1-1/k2. Así, el 75% de los datos al menos, se encuentra a menos de dos desviaciones
típicas y el 89% a menos de tres. (3)

https://sites.google.com/site/estadisticadescriptivaenedu/home/unidad-1/medidas-de-
variabilidad

4. La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una
distribución estadística.

La varianza se representa por .

Calcular la varianza de la distribución:

9, 3, 8, 8, 9, 8, 9, 18

Calcular la varianza de la distribución de la tabla:

xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050

Propiedades de la varianza

1 La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.

2 Si a todos los valores de la variable se les suma un número la varianza no varía.

3 Si todos los valores de la variable se multiplican por


un número la varianza queda multiplicada por el cuadrado de dicho número.

4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se
puede calcular la varianza total.

Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

Observaciones sobre la varianza

1 La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.

2 En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones
están elevadas al cuadrado. (4)

Bibliografía

1. Vitutor (2012). Internet: www.vitutor.com/estadistica/descriptiva/a_10.html


2. Vitutor (2012).Internet: www.vitutor.com/estadistica/descriptiva/a_3.html
3. Estadistica descriptiva en edu.(2006). Internet:
sites.google.com/site/estadisticadescriptivaenedu/
4. Vitutor (2010). Internet: www.vitutor.com/estadistica/descriptiva/a_15.html

Potrebbero piacerti anche