Sei sulla pagina 1di 19

Tema 4: Medidas de posicin individual.

1. Introduccin.
2. Cuantiles: Rangos Percentiles, Percentiles,
Deciles y Cuartiles.
3. Transformaciones lineales: Puntuaciones
tpicas-- Introduccin, clculo y principales
caractersticas.
4. Escalas derivadas basadas en
transformaciones lineales

(Inciso final: El caso de las transformaciones no


lineales)
4.1 Introduccin

En este tema vamos a ver ndices estadsticos que


permiten conocer diversos puntos caractersticos de la
distribucin que no sean necesariamente valores
centrales.

En particular, veremos ndices que nos proporcionarn


informacin de unos datos dentro del conjunto de datos.

Como veremos, una persona con una puntuacin con un


percentil muy alto en un test de inteligencia querr indicar
que dicha persona est muy por encima de la mayora de
personas en inteligencia.

De la misma manera, si sabemos que una persona tienes


una puntuacin tpica positiva elevada en un test de
inteligencia proporciona informacin sobre la inteligencia
de dicha persona (una alta inteligencia en relacin al
grupo).
4.2 Medidas de posicin individual:
centiles
Los centiles dividen la distribucin (ordenada) de datos
en 100 partes. Cada parte contiene 1/100 de las
puntuaciones.

El Centil 60, por ejemplo, es aquella puntuacin que


deja por debajo de s el 60% de los datos. El Centil 15 es
aquella puntuacin que deja por debajo de s el 15% de
los datos.

Los centiles son cuantiles que dividen la distribucin en


100 partes. Hay otros cuantiles. Uno de ellos es la
mediana, que divide la distribucin en dos partes
(Mediana=Centil 50)

Otros cuantiles son los deciles (Decil 1=Centil 10) y los


cuartiles (Cuartil 1=Centil 25, Cuartil 2= Mediana,
Medidas de posicin individual:
centiles
Clculo de centiles

k
Centil k: Posicin de Orden = ( N 1)
100

50
Mediana (Centil Posicin de Orden = ( N 1)
100
50):

NOTA: el clculo lo veremos con datos individuales, y no con datos


agrupados
Rango percentil (RP)

Se trata de una medida inversa del percentil.

Se puede emplear, por ejemplo, para indicar la posicin


del resultado de una prueba de aptitud entre los
resultados de la prueba. Pensemos que una puntuacin
tiene un rango percentil de 78. Eso significa que el 78% de
las otras personas tienen una calificacin inferior.

Clculo (datos sin agrupar):

Para calcular el rango percentil de una medida


cualquiera se cuentan los inferiores a l, se divide ese
nmero entre el nmero total.
(Y se multiplica por 100 y se redondea.)
Ejemplo en Excel pgina de
Microsoft
Funcin Observad: Expresado en
RANGO.PERCENTIL(matriz;x) proporcin, ms que en
porcentaje
4.3 Transformaciones lineales. Puntuaciones
tpicas

Con la forma y=a+bx

Que se emplea por ejemplo, para pasar de grados


Celsius a grados Fahrenheit.

Pero fijaros que esta transformacin no cambia la


forma de la distribucin. (Puede cambiar la media
y la desv.tpica, pero no la forma de la
distribucin.)
Puntuaciones tpicas

Indican el nmero de desviaciones tpicas en


que una observacin se separa de la media
del grupo de datos.

Xi X
zi
sx

La media de las puntuaciones tpicas es 0


La varianza (y desv.tpica) es 1

Observad que las puntuaciones z son abstractas (ello


permite la comparacin de variables con escalas
diferentes).
Puntuaciones tpicas (ejemplo)

Si tenemos dos estudiantes A y B que han


hecho un examen, y sabemos que la
puntuacin tpica de A para el grupo de
estudiantes es de 1 y la puntuacin tpica de
B es de 0, quin tendr mejor nota?
Evidentemente es A; su puntuacin est 1 desv.tpica sobre la
media del grupo; la de B corresponde a la de la media del grupo.

Puntuaciones tpicas y observaciones atpicas

En muchos casos, se suele indicar que si z>3, tales


valores se suelen considerar atpicos. (Que es un
criterio que no tiene por qu coincidir con las
4.4 Escalas derivadas (sobre las
puntuaciones tpicas)

Un pequeo inconveniente de las


puntuaciones tpicas es que conllevan el uso
de valores muy pequeos (con decimales,
habitualmente), as como valores negativos.

Por ello, a veces se efectan


transformaciones lineales sobre las
puntuaciones tpicas. El ejemplo que vamos
a ver son las puntuaciones T (con media 50 y
desv.tpica 10) y con las escalas de CI (con
media 100 y desv.tpica 15).
Puntuaciones T

De manera genrica
Ti agzi b

Observad que la nueva media viene dada por b, y que


la desv.tpica viene dada por el valor absoluto de a

En el caso de las puntuaciones T, a=10 y b=50

Escala de CI

En el caso de la escala de CI:


CI 15gz 100
INCISO: Transformaciones no lineales

Porqu hacemos transformaciones (no lineales)


en los datos?

-Para hacer la distribucin ms simtrica


-Para hacer lineal la relacin entre variables (caso
de tener ms de una variable; estadstica
bi/multivariada)
Una familia de transformaciones especialmente
tiles es la escalera de potencias de Tukey

Corrigen
asimetra
negativa

Corrigen
asimetra positiva
Ejemplo. Datos de TR de un participante

Histograma Descriptivos

Estadstico Error tp.


300 TR_S6 Media 445.0208 8.13721
Intervalo de confianza Lmite inferior 429.0520
para la media al 95% Lmite superior
460.9896

Media recortada al 5% 414.7789


Mediana 386.0000
Varianza 63565.691
200
Desv. tp. 252.12237
Mnimo 2.00
Mximo 2001.00
Rango 1999.00
Amplitud intercuartil 189.0000
Asimetra 2.875 .079
100 Curtosis 12.113 .158
Frecuencia

Desv. tp. = 252.12


Media = 445.0

0 N = 960.00

TR_S6

Observad no slo que hay algunas puntuaciones atpicas a


ambos lados, sino que hay una clara asimetra positiva.
Ejemplo. Datos (transformados; raiz cuadrad) de TR de un participante
(cont.)
Descriptivos
Histograma Estadstico Error tp.
300 RAIZ_S6 Media 20.4522 .16695
Intervalo de confianza Lmite inferior 20.1246
para la media al 95% Lmite superior
20.7798

Media recortada al 5% 20.1056


Mediana 19.6469
Varianza 26.757
200 Desv. tp. 5.17273
Mnimo 1.41
Mximo 44.73
Rango 43.32
Amplitud intercuartil 4.7436
Asimetra 1.229 .079
Curtosis 4.898 .158
100
Frecuencia

Desv. tp. = 5.17


Media = 20.5

0 N = 960.00

HEMOS EFECTUADO LA RAIZ


PARA HACER MS SIMETRICA
RAIZ_S6
LA DISTRIBUCIN.

Observad no slo que an queda algo de asimetra positiva. Con el


logaritmo, podremos reducir ms la asimetra positiva, es lo que
haremos ahora
Ejemplo. Datos (transformados; logaritmo) de TR de un participante
(cont.)
Descriptivos

Estadstico Error tp.


Histograma LOGX_S6 Media 2.5906 .00833
Intervalo de confianza Lmite inferior 2.5742
300 para la media al 95% Lmite superior
2.6069

Media recortada al 5% 2.5958


Mediana 2.5866
Varianza .067
Desv. tp. .25807
Mnimo .30
200 Mximo 3.30
Rango 3.00
Amplitud intercuartil .2078
Asimetra -3.424 .079
Curtosis 29.305 .158

100
Frecuencia

Desv. tp. = .26


Media = 2.59
0 N = 960.00 Nota: Si algn valor
fuera 0, emplear
log(1+x)
LOGX_S6

Observad no slo que la asimetra positiva ha desaparecido (si acaso


hay cierta asimetra negativa causada por unas pocas puntuaciones
atpicas).
Ejemplo. Datos (transformados; cuadrado) de TR de un participante
(cont.)
Nota: Emplear el cuadrado no lo debis hacer para corregir la
asimetra positiva...slo la negativa! Lo que hemos hecho es
aumentar la asimetra positiva y eso no es lo que queramos...
(y si empleamos el cubo, an peor para nuestros fines).
Histograma
Descriptivos
700
Estadstico Error tp.
CUADR_S6 Media 261543.02 14027.10
600 Intervalo de confianza Lmite inferior 234015.68
para la media al 95% Lmite superior
289070.36
500
Media recortada al 5% 191389.16
Mediana 148996.00
400 Varianza 1.89E+11
Desv. tp. 434613.65
300 Mnimo 4.00
Mximo 4004001
Rango 4003997
200
Frecuencia

Amplitud intercuartil 152145.00


Asimetra
Desv. tp. = 434613.6 5.818 .079
100 Curtosis 42.074 .158
Media = 261543.0
0 N = 960.00

CUADR_S6
Esta familia de transformaciones (escalera de
Tukey) tiene importantes propiedades:

1. Preservan el orden de los valores; es decir, los


valores mayores de la escala original seguirn
siendo los valores mayores en la escala
transformada.

2. Modifican la distancia entre los valores. Con


potencias p<1 (raz x o log x) se comprimen los
datos en la parte superior de la distribucin en
relacin a los valores menores; Con potencias
p>1 (como el cuadrado de x) se tiene el efecto
contrario.

3. El efecto sobre la forma de la distribucin


cambia sistemticamente con p. Si raz x hace
menos pronunciada la asimetra positiva de una
distribucin, el log x provocar que la
distribucin resultante sea an menos
asimtrica positiva (en relacin a raz x).
En definitiva, las transformaciones de
potencia pueden hacer que la variable
transformada tenga menos asimetra. Por
qu es eso importante?

Las distribuciones que muestran una clara


asimetra son difciles de estudiar.

Los valores originales aparentemente


atpicos se encontrarn ms cercanos al
grueso de los datos.

Los mtodos estadsticos suelen emplear la


media aritmtica; pero la media de una
distribucin asimtrica no es un buen ndice
del grueso de los datos.

Potrebbero piacerti anche