Sei sulla pagina 1di 7

Percentiles: Interpretaciones y cálculos

Por Jim Frost 2 comentarios

Los percentiles indican el porcentaje de puntajes que caen por debajo de un valor
particular. Te dicen dónde se encuentra una puntuación en relación con otras
puntuaciones. Por ejemplo, una persona con un CI de 120 está en el 91 st percentil,
lo que indica que su IQ es mayor que 91 por ciento de otras puntuaciones.

Los percentiles son una gran herramienta para usar cuando necesitas conocer la
posición relativa de un valor. ¿Dónde cae un valor dentro de una distribución de
valores? Si bien el concepto detrás de los percentiles es sencillo, existen
diferentes métodos matemáticos para calcularlos. En este post, aprenda sobre
percentiles, percentiles especiales y sus usos sorprendentemente flexibles, y los
diversos procedimientos para calcularlos.

Uso de percentiles para entender una puntuación o


valor
Los percentiles te dicen cómo un valor se compara con otros valores. La regla
general es que si el valor X está en el k ésimo percentil, entonces X es mayor que K%
de los valores. Veamos cómo esta información puede ser útil.

A menudo, las unidades para las puntuaciones brutas de las pruebas no son
informativas. Cuando obtienes una puntuación en el SAT, ACT o GRE, las
unidades no tienen significado por sí mismas. Una puntuación total en el SAT de
1340 no es intrínsecamente significativa. En su lugar, realmente desea saber el
porcentaje de examinados que obtuvo mejores calificaciones. Para el SAT, una
puntuación total de 1340 es de aproximadamente el 90 ° percentil. Felicitaciones,
obtuvo un puntaje mejor que el 90% de los demás examinados. Solo el 10%
puntuó mejor que tú. ¡Eso es útil!
A veces, las unidades de medida son significativas, pero todavía le gustaría saber
la posición relativa. Por ejemplo, si su bebé de un mes pesa cinco kilogramos,
podría preguntarse cómo se compara ese peso con otros bebés. Para una niña de
un mes, que equivale al 77 º percentil. Su niña pesa más del 77% de otras niñas
de su edad, mientras que el 23% pesa más que ella. ¡Sabes dónde encaja ella con
su cohorte!

Nombres y usos especiales para percentiles


Damos nombres a percentiles especiales. El 50 ° percentil es el mediana . Este
valor divide un conjunto de datos a la mitad. La mitad de los valores están por
debajo de los 50 th percentil, y medio están por encima de ella. La mediana es una
medida de tendencia central en las estadísticas .

Los cuartiles son valores que dividen sus datos en trimestres y se basan en
percentiles.

o El primer cuartil, también conocido como Q1 o el cuartil más bajo, es el


valor de la 25 º percentil. El cuarto inferior de los puntajes cae por debajo de
este valor, mientras que tres cuartos caen por encima de este valor.
o El segundo cuartil, también conocido como Q2 o la mediana, es el valor de
la 50 ºpercentil. La mitad de los puntajes están arriba y la mitad abajo.
o El tercer cuartil, también conocido como Q3 o el cuartil superior, es el valor
del percentil del 75%. El primer trimestre de las puntuaciones cae por encima
de este valor, mientras que tres cuartos se ubican por debajo de este valor.

El rango intercuartil (IQR) es una medida de dispersión en las estadísticas. Este


rango corresponde a la distancia entre el primer cuartil y el tercer cuartil (IQR = Q3
- Q1). Los IQR más grandes indican que los datos están más dispersos. El rango
intercuartil representa la mitad media de los datos. Un cuarto de los valores cae
por debajo del IQR, mientras que otro cuarto de los valores está por encima de él.

Los percentiles son sorprendentemente versátiles porque puede usarlos no solo


para obtener una posición relativa, sino también para dividir su conjunto de datos
en porciones, identificar la tendencia central y medir la dispersión de una
distribución.

Publicaciones relacionadas : medidas de tendencia central y medidas de


dispersión

Cálculo de percentiles utilizando valores en un


conjunto de datos
Percentil es una palabra bastante común. Sorprendentemente, no hay una sola
definición estándar para ello. En consecuencia, hay múltiples métodos para
calcular los percentiles. En este post, cubro cuatro procedimientos. Los tres
primeros son métodos que los analistas utilizan para calcular los percentiles
cuando observan los valores de datos reales en conjuntos de datos relativamente
pequeños. Estas tres definiciones definen el k ésimo percentil de las siguientes
maneras diferentes:

o El valor más pequeño que es mayor que k por ciento de los valores.
o El valor más pequeño que es mayor o igual al k por ciento de los valores.
o Un valor interpolado entre los dos rangos más cercanos.

Si bien las dos primeras definiciones pueden no parecer drásticamente diferentes,


pueden producir resultados significativamente diferentes, principalmente cuando
se trabaja con un conjunto de datos pequeño. Como verá, esta diferencia se
produce porque las dos primeras definiciones utilizan rangos diferentes que
corresponden a puntajes diferentes. La tercera definición mitiga esta preocupación
al interpolar entre dos rangos para estimar un valor de percentil que cae entre dos
valores.

Para calcular los percentiles utilizando estos tres enfoques, comience por clasificar
su conjunto de datos de los valores más bajos a los más altos.

Vamos a utilizar estos tres métodos con el siguiente conjunto de datos (n = 11)
para encontrar el 70 º percentil.

Definición 1: mayor que


Usando la primera definición, necesitamos encontrar el valor que sea mayor al
70% de los valores, y hay 11 valores. Tomar el 70% de 11, que es 7.7. Entonces,
redondo 7,7 hasta 8. El uso de la primera definición, el valor de los 70 th percentil
debe ser mayor que ocho valores. En consecuencia, escogemos el 9 º valor
clasificado en el conjunto de datos, que es 40.

Definición 2: Mayor o igual que

Usando la segunda definición, necesitamos encontrar el valor que sea mayor o


igual al 70% de los valores. Gracias a la “igual a” parte de la definición, podemos
utilizar la 8 ªvalor clasificado, que es 35.

Usando las dos primeras definiciones, hemos encontrado dos valores para el
percentil del 70%: 35 y 40.

Definición 3: Uso de un enfoque de interpolación

Como se vio anteriormente, el uso de "mayor" o "mayor o igual a" cambia los
resultados. Dependiendo de la naturaleza y el tamaño de su conjunto de datos,
esta diferencia puede ser sustancial. En consecuencia, un tercer enfoque interpola
entre dos valores de datos.

Para calcular un percentil interpolado, haga lo siguiente:

1. Calcula el rango a utilizar para el percentil. Use: rank = p (n + 1), donde p =


el percentil y n = el tamaño de la muestra . Para nuestro ejemplo, para
encontrar el rango de los 70 º percentil, tomamos 0,7 * (11 + 1) = 8,4.
2. Si el rango en el paso 1 es un número entero, encuentre el valor de los
datos que corresponde a ese rango y utilícelo para el percentil.
3. Si el rango no es un número entero, debe interpolar entre las dos
observaciones más cercanas. Para nuestro ejemplo, 8.4 cae entre 8 y 9, que
corresponde a los valores de datos de 35 y 40.
4. Tome la diferencia entre estas dos observaciones y multiplíquela por la
porción fraccionaria del rango. Para nuestro ejemplo, esto es: (40 - 35) 0.4 =
2.
5. Tome el valor de rango inferior en el paso 3 y agregue el valor del paso 4
para obtener el valor interpolado para el percentil. Para nuestro ejemplo, ese
valor es 35 + 2 = 37.

A partir de tres cálculos comunes para los percentiles, nos encontramos con tres
valores diferentes para el 70 ° percentil: 35, 37 y 40.
A continuación, le mostraré un método más para calcular los percentiles que no
usa directamente los valores en el conjunto de datos.

Uso de una función de distribución de probabilidad


para estimar percentiles
Si conoce la función de distribución de probabilidad (PDF) que sigue
a una población de valores, puede usar el PDF para calcular los
percentiles. ¿Acaso la población sigue la distribución normal? O bien, es posible
que haya recopilado una muestra y luego haya identificado el PDF que ofrece el
mejor ajuste.

Lee mi publicación sobre cómo identificar la distribución de tus datos . Este


enfoque identifica la distribución de la población que tiene la mayor probabilidad
(es decir, la probabilidad máxima) de producir la distribución que usted observa en
una muestra aleatoria de esa población.

Después de identificar la distribución para su muestra, puede usar su software


estadístico para calcular el porcentaje de valores en la distribución que cae por
debajo de un valor. Usaré gráficas para mostrar dos ejemplos para aclarar las
ideas. Estoy usando el software estadístico Minitab para generar estos
gráficos. Los datos de un ejemplo siguen una distribución normal, mientras que el
otro sigue una distribución lognormal sesgada . Ambas variables se obtuvieron de
la misma muestra de niñas de secundaria.

Post relacionado : Entendiendo las funciones de distribución de probabilidad

Uso de la distribución normal para estimar percentiles de altura

La altura tiende a seguir la distribución normal, que es el caso de nuestros datos


de muestra. Las alturas para esta población siguen una distribución normal con
una mediade 1.512 metros y una desviación estándar de 0.0741 metros. Para las
poblaciones con distribución normal, puede usar las puntuaciones Z para calcular
los percentiles. Este método es conveniente cuando solo tiene información
resumida sobre una muestra y acceso a una tabla de puntuaciones Z. Hablo sobre
los puntajes Z y muestro cómo usarlos para calcular los percentiles en la
publicación de mi blog sobre la Distribución Normal .

Sin embargo, para esta publicación, usaré la función de densidad de probabilidad


para calcular y graficar el percentil. En este tipo de gráfico de densidad de
probabilidad, la proporción del área sombreada debajo de la curva indica el
porcentaje de la distribución que cae dentro de ese rango de valores. Por esta
gráfica, I sombra la región que contiene el menor 70% de los valores, y el software
calcula la altura que se corresponde con este porcentaje, que es el 70 ° percentil.

El gráfico de arriba muestra que una altura de 1.551 metros está en los
70 th percentil para esta población de niñas de escuela intermedia.

Uso de la distribución lognormal para estimar percentiles de grasa


corporal

No todos los datos siguen la distribución normal. En este sentido, los datos de
porcentaje de grasa corporal para la misma muestra están sesgados. En mi
publicación sobre la identificación de la distribución de sus datos, determiné que
estos datos siguen una distribución lognormal con una ubicación de 3.32317 y una
escala de 0.24188.

La siguiente gráfica muestra claramente el sesgo a la derecha . A continuación,


utilizar el mismo proceso para el cálculo de los 70 th percentil para el porcentaje de
grasa corporal como lo hice para la altura. Solo necesito especificar la distribución
correcta para el software. Usando este enfoque, estamos seguros de tener en
cuenta la asimetría de nuestros datos al obtener percentiles.
El gráfico de arriba muestra que tener grasa corporal 31,5% se encuentra en los
70 thpercentil para esta población de niñas de escuela intermedia.

Los percentiles son una forma muy intuitiva de comprender dónde se encuentra un
valor dentro de una distribución de valores. Sin embargo, si necesita calcular un
percentil, ¡deberá decidir qué método utilizar!

Potrebbero piacerti anche