Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
MEDIDAS DE POSICIN
CENTRO DE CIENCIAS BSICAS
MEDIDAS DE POSICIN
Determinan la ubicacin de los valores que dividen un conjunto de datos en partes iguales.
Percentiles
Percentiles
Calculo del percentil , en datos no agrupados
Paso 1. Ordenar los datos de menor a mayor (colocar los datos en orden ascendente).
Paso 2. Calcular el ndice , a partir de la siguiente frmula
=( )
100
donde es el percentil deseado y n es el nmero de observaciones.
Paso 3. (a) Si no es un nmero entero, debe redondearlo al primer entero mayor. denota la posicin
del percentil p.
(b) Si es un nmero entero, el percentil p es el promedio de los valores en las posiciones e + 1.
Percentiles
Los siguientes son los sueldos mensuales iniciales expresados en dlares, de una muestra de 12 recin
egresados de la carrera de administracin:
ESTADSTICA GENERAL
MEDIDAS DE POSICIN
CENTRO DE CIENCIAS BSICAS
3650 3355 3480 3450 3480 3730 3310 3490 3520 3925 3540 3550
Percentil 50
1. Ordenamos los datos de menor a mayor
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
2. Calculamos el ndice
=( ) =
Como es un nmero entero calculamos el promedio de los datos que estn en las posiciones 6 y 7
3490 + 3520
50 = = 3505
2
Percentil 85
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
2. Calculamos el ndice
=( ) = ,
Como NO es un nmero entero Redondeamos el valor al primer entero mayor, en este caso
= , 11
Por lo tanto el percentil que estamos buscando se encuentra en la posicin 11, es decir, 85 = 3730
Ejemplo 2
Una empresa productora de lminas metlicas utiliza varios reparadores de problemas para hacer
composturas de emergencia en los hornos. Por lo general, este personal realiza varios viajes cortos.
ESTADSTICA GENERAL
MEDIDAS DE POSICIN
CENTRO DE CIENCIAS BSICAS
Para estimar los gastos por viaje del ao prximo, la empresa tom una muestra de 20 cupones de
viaje relacionados con la reparacin de dichos problemas. Se obtuvo la siguiente informacin:
[0-10) 5 2
[10-20) 15 8
[20-30) 25 7
[30-40) 35 2
[40-50] 45 1
Solucin
Para hallar el percentil 50
Utilizamos la expresin
( )
= +
( )
Con k=50, n = 20
Calculamos = = , buscamos en las frecuencias acumuladas el intervalo
[20-30) 25 7 17
[30-40) 35 2 19
[40-50] 45 1 20
( ) ( ) ()
= + = + = 10 + =
( ) ( ) ()
ESTADSTICA GENERAL
MEDIDAS DE POSICIN
CENTRO DE CIENCIAS BSICAS
Cuartiles
Con frecuencia es conveniente dividir los datos en cuatro partes; as, cada parte contiene una cuarta
parte o 25% de las observaciones. En la figura, se muestra una distribucin de datos dividida en cuatro
partes. A los puntos de divisin se
les conoce como cuartiles y estn
definidos como sigue:
Ejemplo 3.
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
3450 + 3480
1 = 25 = = 3465
2
3490+3520
50 = 2
= 3505.
ESTADSTICA GENERAL
MEDIDAS DE POSICIN
CENTRO DE CIENCIAS BSICAS
Para Hallar el cuartil 3
1. Ordenamos los datos de menor a mayor
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
2. Calculamos el ndice
=( ) =
Como es un nmero entero calculamos el promedio de los datos que estn en las posiciones 9 y 10
3550 + 3650
3 = 75 = = 3600
2
Los cuartiles dividen los datos de los sueldos iniciales en cuatro partes y cada parte contiene 25% de
las observaciones
Se utiliza para describir un conjunto de datos. El resumen de cinco puntos est integrado por:
Es una representacin grfica basada en cuartiles, que describen o ilustran un conjunto de datos. Para
elaborar un Box Plot solo se necesita el resumen de cinco puntos, que se localizan sobre una escala,
ya sea vertical u horizontal. La caja se utiliza para mostrar la distribucin entre Q1 y Q3 y los
bigotes son segmentos de recta que representa al 25% de los datos menor que el primer cuartil (Q1)
y el 25% mayor que el cuartil tres (Q3).
El box Plot de la grafica 1, muestra una distribucin de cola derecha, lo cual indica que existe un
sesgo hacia el lado derecho, es decir que la mayor dispersin de los datos est hacia este lado y la
mayor densidad de los datos hacia el lado izquierdo. En la grfica 2 se presenta una distribucin de
cola izquierda, la mayor concentracin de los datos se encuentra al lado derecho.
EJEMPLO 5
Podemos inferir a partir del grafico anterior que el 75% de los estudiantes de la IUSH tienen mximo
25 aos. Los puntos que aparecen en la parte superior se conocen con el nombre de outliers (valores
atpicos), e indican datos que presentan poca frecuencia y se consideran fuera de lo normal.
Estos valores atpicos son valores que numricamente son distantes de los datos.
Si no son tenidos en cuenta a la hora de procesar nuestra informacin los resultados obtenidos pueden
ser engaosos.
Por ejemplo si evaluamos la edad de 10 estudiantes de medicina del primer ao, la mayora tiene entre
17 y 20 aos, si encontramos un sujeto de 62 aos, la mediana puede ser 19 pero el promedio podra
ser 23 aos. En este caso la mediana refleja mejor la distribucin de los datos.
Los diagramas de caja y bigotes o Box Plot, tambin se utilizan para realizar anlisis comparativos
entre diferentes categoras con una variable comn, as como se expresa en el siguiente diagrama: