Capitulo 4

Capítulo 4
Estadística descriptiva para una variable (II): Variabilidad,

forma, tipos de puntuaciones y análisis exploratorio
Francisco J. Herrero y Marcelino Cuesta
Universidad de Oviedo
Estadísticos de variabilidad
Entropía
La entropía es uno de los pocos estadísticos de variabilidad admisibles en variables categóricas,

y quizá el más aconsejable. La expresión matemática suele ser descrita como:
k
H = − ∑ f i * log 2 ( f i )
i =1
donde...
fi : referencia la frecuencia relativa o proporción de cada modalidad i
log2 : logaritmo en base 2
La conveniencia de la utilización de la base 2 de los logaritmos se debe a que es el más adecuado

en variables categóricas, de forma semejante a la que tiene en la teoría de la información. (Herman,
1986).
Supongamos, que tenemos la tabla siguiente:

Religión Frecuencia Frecuencia
profesada (F) relativa (f)
Católica (1) 10 0,5
Protestante (3) 2 0,1
Otras (2) 8 0,4
Total 20 1
aplicando la formula anterior:
[ ]
H = − (0,5 * log 2 (0,5)) + (0,1 * log 2 (0,1)) + (0,4 * log 2 (0,4)) = 1,36
Existen dos reformulaciones o alternativas al modelo que acabamos de ver, dependiendo bastante
de la idiosincrasia de los investigadores la aplicación de unas u otras. La primera alternativa se basa en
utilizar los logaritmos naturales:
k
H = − ∑ f i * ln( f i )
i =1
Mientras la segunda se basa en usar los logaritmos en base 3.
k
H = − ∑ f i * log 3 ( f i )
i =1
1
Amplitud total, recorrido o rango
Este estadístico de variabilidad suele ser utilizado en variables cuasi-cuantitativas. La expresión

matemática suele ser descrita como la diferencia entre las dos puntuaciones extremas.
AT = M - m
donde ...
M: referencia el valor mayor de la variable
m: señala el valor más pequeño de la variable
Por ejemplo, supongamos que tenemos la serie de valores ordenados: 3, 12, 14, 18, 26
AT = 26 - 3 = 23
Si los valores correspondiesen a una variable continua la operación se basaría en manejar sus
límites reales, con lo cual la solución sería:
AT = 26,6 -2,5 = 24
Amplitud semi-intercuartil
Aplicada en variables cuasi-cuantitativas por defecto, también es una alternativa en variables

cuantitativas con problemas metodológicos (ej: valores muy extremos o distribuciones asimétricas). Su
cálculo se basa en el manejo de la información percentilar.
ASI = (Q3 -Q1) / 2 = (P75 - P25) / 2
donde...
Q3: Percentil 75 o cuartil 3
Q1: Percentil 25 o cuartil 1
Desviación media
Aplicada a partir de variables cuantitativas, es la media de las diferencias absolutas entre los
valores de la variable y su media:
∑ i =1
Xi − X
DM =
n
Si los datos de partida están agrupados en intervalos compuestos, la fórmula a utilizar es:
∑F
i =1
i Xi − X
DM =
n
Varianza y desviación típica
Como en el caso anterior se aplican en variables cuantitativas. La varianza se define como la

media de las diferencias cuadráticas entre los valores de la variable y su media:
n 2
∑ (X
i =1
i − X)
Sx =
2
n
2
Si los datos de partida están agrupados en intervalos compuestos, la formula a utilizar es:
n 2
∑ F (X
i =1
i i − X)
Sx =
2
n
donde...
Fi: Frecuencia absoluta del intervalo.
Xi: Punto medio del intervalo.
Existen reformulaciones cuya finalidad es facilitar el cálculo manual, entre ellas podemos ver la
siguiente:
∑X
i =1
i
2
2
Sx 2 = − X
n
o bien...
2
n
⎛ n ⎞
n*∑ Xi − ⎜ ∑ Xi ⎟
2
i =1 ⎝ i =1 ⎠
Sx =
2
n
Al estar expresado en unidades cuadráticas generalmente es un estadístico con resultados
elevados, por lo cual se prefiere usar la versión lineal correspondiente (desviación típica). Este se obtiene
simplemente calculando la raíz cuadrada de la varianza:
SX = SX 2
La forma más frecuente de encontrar denotado este estadístico es con la letra “S” si se refiere a
datos muestrales, mientras si se refiere a la población se suele usar la letra griega “sigma”(F).
Propiedades básicas
- El estadístico nunca es negativo.

- El estadístico nunca es 0, ya que en este caso los datos corresponden con una constante.
- Si a la variable se le suma o resta una constante k el valor del estadístico permanece invariante.
- Si le multiplicamos una constante k el estadístico se modifica de acuerdo a la expresión
general:
S y 2 = Sx 2 * k 2
y en el caso de la desviación típica:
S y = S x *| k |
- Si se modifica una simple puntuación automáticamente se alteran los resultados del estadístico.
- La varianza se expresa en unidades cuadráticas y la desviación típica en la misma unidad que
los datos originales.
Coeficiente de variación
3
Este estadístico debe ser utilizado para comparar la variabilidad de dos o más conjuntos de datos,
y cuando la mera comparación de los estadísticos varianza o desviación típica no es admisible. Y esto
ocurre, cuando bien los rangos son sensiblemente distintos (ej: notas y CI) o bien cuando teniendo el
mismo rango las medias son sensiblemente distintas.
La forma de eliminar estas dificultades es manejando la siguiente expresión:
Sx
CVx =
X
(PIR 1999, preg. 44; autoeval. 13)

que podemos encontrar también expresada en forma porcentual:
Sx
CVx = *100
X
Propiedades básicas.
-Puede dar un resultado negativo en la medida que una media puede ser negativa. No obstante en esta
situación se tomará el valor absoluto del resultado.
-Si a la variable se le suma una constante k el valor del estadístico disminuye. Esto es así, porque al sumar
una constante a una variable se modifica el promedio pero no la dispersión.
-Si le restamos una constante k el valor del estadístico aumenta.
-Si le multiplicamos una constante se mantiene, ya que el producto afecta tanto al promedio como a la
dispersión en la misma magnitud
Tipos de puntuaciones
Puntuación directa
La puntuación directa es el valor numérico obtenido al aplicar la escala de medida a una

propiedad o característica. En análisis de datos se suelen representar por las letras mayúsculas latinas (ej.:
X, Y , Z ....).
Puntuación diferencial
La puntuación diferencial es el resultado de poner en relación la distancia existente entre una

puntuación directa y su promedio. En análisis de datos se suelen representar por las letras minúsculas
latinas (ej.: x, y , ...), de esta forma las puntuaciones diferenciales para una variable X la podríamos
denotar como el resultado:
xi = X i − X
Este tipo de puntuaciones presentan como propiedades más interesantes:

1.- La media vale 0.
2.- La varianza es la misma que en puntuaciones directas.
En general la información aportada nos indica si un valor concreto está por encima de la media
(valor positivo), es inferior (valor negativo) o coincide con ella (valor nulo).
Puntuación típica
La puntuación típica es el resultado de operar el cociente entre una puntuación diferencial y la

desviación típica correspondiente de la variable. En análisis de datos se suelen representar por las letra
mayúscula latina Z y en forma de subíndice la variable estandarizada (tipificada) correspondiente (ej.:
4
Zx, Zy , ...), de esta forma las puntuaciones típicas para una variable X la podríamos denotar como el
resultado de operar:
Xi − X x
Z xi = = i
Sx Sx
Este tipo de puntuaciones presentan las propiedades más interesantes:

1.- La media vale 0 (PIR 2001, preg. 114; autoeval. 15).
2.- La varianza es 1 (PIR 2001, preg. 121; autoeval. 16).
3.- Si aplicamos a las puntuaciones típicas una transformación lineal: a+b*Z, la nueva variable
tendrá como media a y como desviación típica |b|.
Como se puede ver una puntuación típica nos señala el número de desviaciones típicas a que se
encuentra una puntuación respecto a su promedio (PIR 1999, preg. 43; autoeval. 12) (PIR 2001, preg.
127; autoeval. 17). Dicho de otra forma, la magnitud de la distancia respecto al centro de la distribución
de la variable medido en desviaciones típicas (PIR 1999, preg. 53; autoeval. 14).
Estadísticos de forma
Asimetría
Nos indica en que posición de la variable se encuentran la mayoría de los casos, bien en el
extremo inferior (asimetría positiva),
50
40
30
20
Frecuencia
10
0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0
Asimetría positiva
en el extremo superior (asimetría negativa),
50
40
30
20
Frecuencia
10
0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0
Asimetría negativa
5
o bien en el centro (simétrica).
50
40
30
20
Frecuencia
10
0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0
Simétrica
La fórmula clásica es:
∑ (X − X)
n
3
i
i =1
As =
n * Sx 3
donde el resultado será:

0: simétrica
>0: asimétrica positiva
<0: asimétrica negativa
Un valor de asimetría mayor que 1, en valor absoluto, indica generalmente una distribución que
difiere de manera significativa de la simetría. Cuando la distribución es simétrica y unimodal media,
mediana y moda coinciden, aunque no siempre se cumple que la coincidencia de los tres estadísticos
implique simetría.
Curtosis
Este estadístico nos indica el grado de concentración de la información en torno al centro de la

distribución, es decir en que medida las observaciones están agrupadas en torno al punto central. Cuanto
más concentración más apuntada es la forma gráfica de la distribución (leptocúrtica), mientras en el caso
contrario la forma es aplastada (platocúrtica). La situación intermedia, mesocúrtica, corresponde con lo
que más adelante llamaremos curva normal.
70
60
50
40
30
20
Frecuencia
10
0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0
Leptocurtica 6
50
40
30
20
Frecuencia
10
0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0
Platocurtica
50
40
30
20
Frecuencia
10
0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0
Mesocurtica
La fórmula clásica es:
∑ (X − X)
n
4
i
i =1
K= −3
n * Sx 4
donde el resultado será:

0: mesocúrtica
>0: leptocúrtica
<0: platocúrtica
La curva normal
Como regla general una distribución normal se aplica a variables cuantitativas continuas y
cumple el modelo que podemos formalizar mediante la siguiente integral:
+∞ ⎛ 1 X −μ ⎞ 2
1 *⎜ ⎟
∫
−∞σ * 2 * π
* e 2 ⎝ σ ⎠
=1
Por supuesto, existen infinidad de curvas normales, dependiendo de sus parámetros básicos de
promedio y dispersión, lo cual plantea problemas serios a la hora de comparar resultados de estudios con
distintas distribuciones. Con objeto de unificar el modelo se suele aplicar no sobre las puntuaciones
directas, sino sobre las típicas, de forma tal que ahora lo podemos formalizar como:
7
+∞ Z 2
1
F ( Zi ) = ∫
−∞ 2 *π
*e 2 = 1
que es lo que se conoce como curva normal unitaria. En todo caso no es necesario aplicar en cada caso la
formulación pues existen tablas que nos permiten dada una proporción encontrar su puntuación típica y a
la inversa.
Algunas propiedades de esta curva son:

- Es simétrica y mesocúrtica. Por tanto, media , mediana y moda coinciden.
- Es asintótica, o lo que es lo mismo, no tiene límites fijos conocidos (amplitud infinita).
- Tiene dos puntos de inflexión donde la curva pasa de tener una forma cóncava a convexa (a una
desviación típica de la media).
- El porcentaje de casos entre -1Z y 1Z se encuentra el 31,74
o lo que es los mismo, el porcentaje de casos entre el centro de la distribución y 1Z=15,87%, siendo la
misma cantidad respecto a -1Z.
Por otra parte, podemos deducir que fuera del área se encuentra el resto de los casos que
representan el 68,26%, que distribuidos de forma simétrica significa que desde menos infinito a -1Z el
porcentaje será del 34,13%, y el mismo porcentaje desde 1Z a más infinito.
- El porcentaje de casos entre -2Z y 2Z se encuentra el 95,44
El resto de los casos fuera del área de distribución representará el 4,56%, que significa que desde
-2Z a -infinito existe el 2,28% y desde 2Z a más infinito la misma cantidad.
8
- El porcentaje de casos entre -3Z y 3Z es el 99,74
El resto de los casos fuera del área de distribución representará el 0,26%, que significa que desde
-3Z a -infinito existe el 0,13% y desde 3Z a más infinito la misma cantidad.
- Por último, el porcentaje de casos entre -0,5Z y 0,5Z es del 38,3%, o lo que es lo mismo el área
fuera de esos límites es del 61,7%. (PIR 1999, preg. 40;autoeval. 11)
Puntuación típica normalizada
La puntuación típica normalizada debería ser utilizada en lugar de la Z empírica cuando la

distribución de la variable no se ajusta de forma adecuada al modelo de curva normal. Se obtiene como el
resultado de operar en las tablas de frecuencias las proporciones acumuladas, se hace corresponder a cada
proporción acumulada la correspondiente Z en el modelo de la curva normal unitaria.
Por ejemplo, si la puntuación directa 30 corresponde con una proporción acumulada de 0,0336,
buscamos ese área en el modelo de la curva y encontraremos entonces la solución en Z= -1,83.
Puntuación típicas transformadas
En psicología podemos encontrarnos con la necesidad de utilizar un tipo de escalas artificiales,

que sean más fáciles de comprender a usuarios no expertos en estadística. Nos encontraremos entonces en
la situación de utilizar las puntuaciones típicas transformadas, llamadas así por basarse el cálculo en las
puntuaciones típicas (Z) que se asume deberán cumplir en su distribución el modelo de normalidad.
Un ejemplo de este tipo de escalas es el tradicional CI, escala que se suelen trabajar con los
parámetros de media 100 y dispersión 15. Por ejemplo, supongamos que deseamos transformar la
puntuación 13 de un test en su equivalente de la escala de inteligencia. Para ello obtenemos la Z de dicha
puntuación y a continuación aplicamos la transformación lineal: CI= Z*15+100. Supongamos que a la
puntuación 13 le corresponde una Z de 2, entonces el CI será el resultado de operar 2*15+100, es decir
130.
Otro tipo de transformaciones artificiales del mismo tipo son admisibles, por ejemplo escalas con
media 5 y desviación típica 1, o media 500 y desviación típica 100.
En general la expresión sería:
PT = Z*S + X
donde:
PT: es la puntuación transformada.
S: es la desviación típica de la nueva escala.
X : es la media de la nueva escala.
Si la distribución no es normal, convendría utilizar la Z normalizada y no la empírica, con objeto

de obtener una nueva escala artificial ajustada al modelo de normalidad
9
Análisis exploratorio de datos
El análisis exploratorio de datos (AED) es una nueva estrategia de manipular la información

recogida en las observaciones y/o experimentos psicológicos. El AED plantea que un investigador debe
tener en cuenta siempre que es posible encontrar elementos no esperados en un primer momento por el
modelo teórico utilizado, y por tanto debe estar abierto a estas posibilidades cuando analiza los datos. Es
una nueva actitud o perspectiva donde el escepticismo y la apertura (exploración) son los elementos
característicos de esta nueva aproximación.
De forma mecánica en Ciencias Sociales se utilizan los estadísticos (índices), por considerarlos
mucho más potentes que las representaciones gráficas. El escepticismo en AED hace referencia a que
estos índices estadístico que resumen las variables deben ser tomados siempre con mucho cuidado , ya
que frecuentemente pueden aportar información errónea sobre los datos (ocultar información). Acentúa el
uso de las representaciones gráficas, ya que puede indicarnos visualmente posibles patrones alternativos
que podrían aportar información relevante sobre las conductas estudiadas.
Por último, señalar que junto al desarrollo de técnicas gráficas esta aproximación desarrolla
también índices estadísticos, conocidos como robustos, por ser bastante resistentes a los comportamientos
extremos de las variables y de los cuales no nos ocuparemos aquí por motivos de espacio.
Diagrama de tallo y hojas
Es una herramienta gráfica que combina la información de la tabla de frecuencias y del

histograma, donde se muestran todos los casos estudiados. Muestra la distribución de los valores para una
variable, donde cada valor observado se divide en dos componentes: el dígito final (la hoja) y los dígitos
precedentes (el tallo).
Como se construye o elabora este diagrama es lo que vamos a ver a continuación.
Supongamos que tenemos las siguientes puntuaciones en un test de memoria:
25 3 11 32 24 47 12 5 31 9 12 32 16 25 28 33 13 20 31 19 20 34 18 23 24 25 29 26
55 44 46 36 40 45 36 44 43 54 38 39 43 2 54
En primer lugar lo primero que debe realizarse es ordenar de forma ascendente las puntuaciones
anteriores:
2 3 5 9 11 12 12 13 16 18 19 20 20 23 24 24 25 25 25 26 28 29 31 31 32 32 33 34
36 36 38 39 40 43 43 44 45 46 47 54 54 55
A continuación se construye el área de los tallos, que vamos a construir en un primer momento
de amplitud 10:
0
1
2
3
4
5
Y después rellenamos la zona de las hojas, con las unidades correspondientes de los valores:
10
0 2359
1 1223689
2 344555689
3 1122346689
4 334567
5 445
Posteriormente, se suele completar en la parte izquierda del diagrama con las frecuencias:
Frecuencias Tallo Hojas

4 0 2359
7 1 1223689
11 2 00344555689
10 3 1122346689
7 4 334567
3 5 445
Por supuesto, podemos utilizar otra amplitud del intervalo, por ejemplo 5, con lo cual
obtendríamos un diagrama como este:
Frecuencias Tallo Hojas

2 0- 23
2 0+ 59
4 1- 1223
3 1+ 689
5 2- 344
6 2+ 555689
6 3- 112234
4 3+ 6689
4 4- 334
3 4+ 567
2 5- 44
1 5+ 5
Donde el signo - indica que la hoja toma valores entre 0 y 4 y el signo + que la hoja toma valores entre 5
y 9.
Diagrama de cajas
Este gráfico persigue facilitar la inspección visual de la distribución de frecuencias. Básicamente

aporta a nivel icónico la posición de los cuartiles, la distancia entre los cuartiles, el grado de simetría de la
distribución y la existencia o no de puntuaciones fuertemente extremas (casos atípicos).
Supongamos que la distribución de frecuencias de nuestra variable inteligencia es la siguiente:
11
CI
Frecuencia
Válidos 80,00 1
90,00 2
100,00 3
110,00 2
120,00 1
Total 9
donde los cuartiles son:
Estadísticos
CI
Percentiles 25 90,0000
50 100,0000
75 110,0000
lo cual nos dará lugar al siguiente gráfico:

130
120
110
100
90
80
70
60
50
40
30
20
10
0
N= 9
CI
Como puede verse los extremos de la gráfica representan el valor menor y mayor de la
distribución, los límites de la “caja” corresponden a los centiles 25 y 75 y la línea interior de la caja
representa el valor de la mediana. Cuanto más alta sea la gráfica mayor es la dispersión de la distribución
y cuanto más alejada del centro de la caja esté la línea de la mediana mayor será la asimetría.
Supongamos que la puntuación más baja no es 80, sino 60, con lo cual la tabla de frecuencias es:
CI
Frecuencia
Válidos 60,00 1
90,00 2
100,00 3
110,00 2
120,00 1
Total 9
no afectando a los cuartiles, pero si al diagrama:
12
130
120
110
100
90
80
70
60 1
50
40
30
20
10
0
N= 9
CI
Nótese como el segmento inferior ha desaparecido, y aparece ahora una “O” identificador de la
puntuación “outlier” (atípica) asociada al valor 60. El segmento inferior no se dibuja por coincidir el
siguiente valor, una vez eliminado el caso del valor atípico, con el percentil 25 que es la base de la caja.
Los limites a partir de los cuales los valores comienzan a ser considerados como puntuaciones
atípicas se obtienen al operar:
Li = Q1 - (AI * 1,5)
Ls = Q3 + (AI * 1,5)
donde...
Ls = Area superior a partir de la cual un valor pasa a ser un dato atípico
Li = Area inferior de los valores atípicos
AI = Q3-Q1
En el ejemplo que estamos viendo estos límites serán:

Li = 90 - (20*1,5) = 60
Ls = 110 + (20*15)=140
Por lo cual la puntuación 60 esta en el área de valores atípicos, siendo representado en el gráfico
por el símbolo “O”.
Supongamos que la distribución es ahora la siguiente, donde la puntuación 60 ha sido sustituida

por otra menor:
CI
Frecuencia
Válidos 30,00 1
90,00 2
100,00 3
110,00 2
120,00 1
Total 9
lo cual no afecta como en el caso anterior a los cuartiles, pero si al diagrama como podemos ver a
continuación:
13
140
120
100
80
60
40
20
0
N= 9
CI
donde el símbolo “*” referencia el valor 30 como extremo. Este nuevo tipo de valor se obtiene a partir de
delimitar el área de puntuaciones extremas, de acuerdo a la expresión:
Li = Q1 - (AI * 3)
Ls = Q3 + (AI * 3)
donde...
Ls = Area superior a partir de la cual un valor pasa a ser un dato extremo
Li = Area inferior de los valores extremos
AI = Q3-Q1
En el ejemplo estos límites serán:

Li = 90 - (20*3) = 30
Ls = 110 + (20*3)=170
Por lo cual la puntuación 30 está en el área de valores extremos, siendo representado en el

gráfico por el símbolo “*”.
Referencias bibliográficas
Herman,J. (1986) Analyse de données qualitatives. 1. Traitement d’enquêtes échantillon, répartitions,

associations. Paris: Masson.
Autoevaluación
1.- Suponiendo los resultados de los estadísticos de asimetría y curtosis, identifica que combinación de
valores se alejan más de la distribución de normalidad.
a.- 1; 0,5
b.- 0,3; 0,2
c.- 1; 1
d.- 1,5; 1,5
e.- 0,75; 1
2.- Suponiendo que la media y la desviación típica de una muestra normal son 60 y 10 respectivamente,
calcular la moda de la muestra:
a.- 10
b.- 60
c.- 70
d.- 0
e.- no se puede calcular, pues falta la mediana.
14
3.- Si tenemos una variable que se distribuye entre los valores 1 y 100, identifica que par de valores
(Media y Desviación típica) es el correcto:
a.- 50; -5
b.- 0; 30
c.- 100; 30
d.- 50; 0
e.- 40; 20
4.- Si tenemos una variable que se distribuye normalmente con media 50 y desviación típica 10,
identifica que valor es que corresponde a una Z de 2:
a.- 50
b.- 30
c.- 70
d.- 10
e.- 20
5.- Si a las puntuaciones de una variable X le multiplicamos siempre la cantidad 3, entonces su nueva
desviación típica será:
a.- Sx+3
b.- Sx*3
c.- Sx/3
d.- 1/Sx
e.- Sx
6.- Dado siguiente diagrama de tallo y hojas:
1 134
2 3355557
3 1244
4 36
5 1
entonces la moda será:
a.- 25
b.- 5555
c.- 20
d.- 11
e.- 44
7.- En el caso anterior ¿cuál será la mediana?

a.- 25
b.- 5555
c.- 20
d.- 11
e.- 44
8.- En una variable con distribución normal sabemos que la puntuación directa 20 corresponde con el
centil 25, y que la amplitud semiintercuartílica vale 5, ¿cuál es el valor de la moda de dicha distribución?
a.- 25
b.- 20
c.- 30
d.- 50
e.- no se puede determinar
9.- Dadas las siguientes variables con su correspondiente media y desviación típica
Variables X1 X2 X3 X4 X5
Media 60 3 500 30 6
Desv. Típica 20 1 100 12 3
15
¿cuál es la de mayor variabilidad relativa?
a.- X1
b.- X2
c.- X3
d.- X4
e.- X5
10.- Dada la variable X con media 50 y varianza 16, ¿qué puntuación típica le corresponde a un sujeto
con una puntuación diferencial de -2?
a.- 0
b.- (-0,5)
c.- 0,5
d.- 48
e.- (-2)
11.- (PIR 1999, preg. 40) Si P(z<-0,5) = 0,3085 y P (z<0,5) = 0,6915, ¿qué porcentaje de una población
con distribución normal puede esperarse que obtenga puntuaciones comprendidas entre z = -0,5 y z = 0,5?
a.- 1,0000
b.- 0,6915
c.- 0,5000
d.- 0,3830
e.- 0,3085
12.- (PIR 1999, preg. 43) Una puntuación típica igual a 2 indica que la puntuación directa
correspondiente:
a.- Se separa de la media dos unidades
b.- Se separa de la media dos veces el valor de la desviación típica
c.- Es el doble de la media
d.- Se separa de la media dos unidades en valor absoluto
e.- Es menor que la puntuación media
13.- (PIR 1999, preg. 44) La unidad de medida en que se expresa el coeficiente de variación es:
a.- La misma en la que están expresados los datos
b.- La de los datos al cuadrado
c.- Aquella en la que viene expresada la desviación típica
d.- Aquella en la que viene expresada la media y la desviación típica
e.- En ninguna
14.- (PIR 1999, preg. 53) Una puntuación típica indica:

a.- El valor promedio de una distribución de frecuencias
b.- La dispersión de una distribución
c.- La probabilidad de cometer error en una predicción probabilística
d.- El número de desviaciones típicas que una observación se separa de la media de su grupo
e.- Una propiedad de la distribución
15.- (PIR 2001, preg. 114) Se tiene una variable Xi, con un número de personas en la muestra igual a n, se
tipifica cada valor de Xi en su correspondiente valor zi. ¿Cuánto vale la media de las puntuaciones típicas,
z ?:
a.- z =1
b.- z=n
c.- z=0
d.- z= X
e.- z = Sx
16
16.- (PIR 2001, preg. 121) Se tiene una variable Xi, con un número de personas en la muestra igual a n, se
tipifica cada valor de Xi en su correspondiente valor zi. ¿Cuánto vale la varianza de las puntuaciones
típicas, S2z?:
a.- S2z = 1
b.- S2z = n
c.- S2z = 0
d.- S2z = X
e.- S2z = S2X
17.- (PIR 2001, preg. 127) Un alumno obtiene en un test una puntuación típica igual a -0'25 (zi = -0'25).
¿Qué significa este dato?:
a.- Que deja por debajo de sí al 25% de los valores de ese test en la muestra estudiada
b.- Que deja por debajo de sí al 75% de los valores de ese test en la muestra estudiada
c.- Que el valor directo de esa puntuación es el de la media multiplicada por 0'25
d.- Que la posición relativa de esa puntuación es de 0'25 desviaciones típicas por debajo de la
media
e.- Que la posición relativa de esa puntuación es de 0'25 desviaciones típicas por encima de la
media
Respuestas correctas
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
d b e c b a a a e b d b d d c A d
17

Capitulo 4

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Capitulo 4

Caricato da

Copyright:

Formati disponibili

Capítulo 4

Estadística descriptiva para una variable (II): Variabilidad,

La entropía es uno de los pocos estadísticos de variabilidad admisibles en variables categóricas,

La conveniencia de la utilización de la base 2 de los logaritmos se debe a que es el más adecuado

Supongamos, que tenemos la tabla siguiente:

Protestante (3) 2 0,1

Otras (2) 8 0,4

aplicando la formula anterior:

Mientras la segunda se basa en usar los logaritmos en base 3.

Este estadístico de variabilidad suele ser utilizado en variables cuasi-cuantitativas. La expresión

Aplicada en variables cuasi-cuantitativas por defecto, también es una alternativa en variables

ASI = (Q3 -Q1) / 2 = (P75 - P25) / 2

Como en el caso anterior se aplican en variables cuantitativas. La varianza se define como la

- El estadístico nunca es negativo.

y en el caso de la desviación típica:

(PIR 1999, preg. 44; autoeval. 13)

La puntuación directa es el valor numérico obtenido al aplicar la escala de medida a una

La puntuación diferencial es el resultado de poner en relación la distancia existente entre una

Este tipo de puntuaciones presentan como propiedades más interesantes:

La puntuación típica es el resultado de operar el cociente entre una puntuación diferencial y la

Este tipo de puntuaciones presentan las propiedades más interesantes:

en el extremo superior (asimetría negativa),

La fórmula clásica es:

donde el resultado será:

Este estadístico nos indica el grado de concentración de la información en torno al centro de la

La fórmula clásica es:

donde el resultado será:

Algunas propiedades de esta curva son:

Puntuación típica normalizada

La puntuación típica normalizada debería ser utilizada en lugar de la Z empírica cuando la

Puntuación típicas transformadas

En psicología podemos encontrarnos con la necesidad de utilizar un tipo de escalas artificiales,

Si la distribución no es normal, convendría utilizar la Z normalizada y no la empírica, con objeto

El análisis exploratorio de datos (AED) es una nueva estrategia de manipular la información

Diagrama de tallo y hojas

Es una herramienta gráfica que combina la información de la tabla de frecuencias y del

Frecuencias Tallo Hojas

Frecuencias Tallo Hojas

Este gráfico persigue facilitar la inspección visual de la distribución de frecuencias. Básicamente

Supongamos que la distribución de frecuencias de nuestra variable inteligencia es la siguiente:

donde los cuartiles son:

lo cual nos dará lugar al siguiente gráfico:

no afectando a los cuartiles, pero si al diagrama:

En el ejemplo que estamos viendo estos límites serán:

Supongamos que la distribución es ahora la siguiente, donde la puntuación 60 ha sido sustituida

En el ejemplo estos límites serán:

Por lo cual la puntuación 30 está en el área de valores extremos, siendo representado en el

Herman,J. (1986) Analyse de données qualitatives. 1. Traitement d’enquêtes échantillon, répartitions,

6.- Dado siguiente diagrama de tallo y hojas:

7.- En el caso anterior ¿cuál será la mediana?

14.- (PIR 1999, preg. 53) Una puntuación típica indica:

Potrebbero piacerti anche