Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Marca de clase
Media ponderada
Ponderacin
Los valores cercanos tienen una desviacin estndar menor, y los valores con una variacin
mucho mayor tienen una desviacin estndar ms grande.
La desviacin estndar tiene las mismas unidades de medicin (como minutos, gramos o dlares)
de los datos originales.
Para muchos conjuntos de datos, un valor es inusual si difiere de la media por ms de dos
desviaciones estndar.
Cuando se compara la variacin de dos conjuntos de datos diferentes, solo se comparan las
desviaciones estndar si los conjuntos de datos utilizan la misma escala y las mismas unidades, y
si sus medias son aproximadamente iguales.
Desviacin estndar de la poblacin
Varianza
La varianza de un conjunto de valores es una medida de variacin igual al cuadrado de la
desviacin estndar
Ejercicio:
Notacin
n nmero total de valores en el conjunto de datos
K percentil utilizado (Ejemplo: para el percentil 25, k = 25).
L localizador que da la posicin de un valor (Ejemplo: para el valor en
el lugar 12 en la lista ordenada, L = 12).
Pk percentil k-simo (Ejemplo: P25 es el percentil 25)
Procedimiento para el
clculo
Calcular el valor del percentil 90, P90
L = 31.5 no es un nmero entero.
Siguiendo el mecanismo descrito
modificamos L al redondearlo de
31.5 a 32.
En el ltimo recuadro observamos
que el valor de P90 es el 32 valor,
contando desde el ms bajo.
Es decir, P90 = $150 millones.
Por lo tanto, alrededor del 90% de
las pelculas tienen presupuestos
por debajo de $150 millones, y
aproximadamente el 10% de las
pelculas tienen presupuestos por
encima de $150 millones
Calcular el valor del percentil 60, P60
Q1 (Primer Cuartil) Separa el 25% inferior de los valores ordenados del 75%
superior. (Para ser ms precisos, al menos el 25% de los valores ordenados son
menores que o iguales a Q1, y al menos el 75% de los valores son mayores que o
iguales a Q1).
Q2 (Segundo Cuartil) Igual a la mediana; separa el 50% inferior de los valores
ordenados del 50% superior.
Q3 (Tercer cuartil) Separa el 75% inferior de los valores ordenados del 25%
superior. (Para ser ms precisos, al menos el 75% de los valores ordenados son
menores que o iguales a Q3, y al menos el 25% de los valores son mayores que o
iguales a Q3)
Cuartiles
Resumen de los 5 nmeros y grfica de caja
El resumen de los 5 nmeros consiste en reportar el valor mnimo; el
primer cuartil, Q1; la mediana (o segundo cuartil, Q2); el tercer
cuartil, Q3; y el valor mximo
En una grfica de caja (o diagrama de caja y bigotes) se representa
un conjunto de datos consistente en una lnea que se extiende desde
el valor mnimo hasta el valor mximo, y un caja con lneas trazadas
en el primer cuartil, Q1, la mediana y el tercer cuartil, Q3
Ejercicio
Realice un grfico de caja y bigotes para el conjunto de datos del
ejemplo anterior
Su grfico debe verse aproximadamente as
Valores atpicos y grficas de caja modificadas
Se acepta que un valor es atpico si se encuentra por arriba de Q3 en una
cantidad mayor que 1.5RIC o 1,5RIC por debajo de Q1