Sei sulla pagina 1di 6

Tipificacin y estandarizacin de variables aleatorias

Claudia Guerrero Seplveda

TIPIFICACIN, ESTANDARIZACIN, transformacin de variables


Es un procedimiento que facilita la comparacin entre:
-

Los valores de dos distribuciones distintas.


Los valores de variables con unidades distintas
Reconocimiento de valores atpicos o dentro de ciertos valores de acuerdo a la regla
emprica

Una variable est tipificada o estandarizada cuando a sus valores se les resta su media aritmtica y
se les divide por su desviacin estndar

zi =

xi x

El resultado de esta operacin es otra variable (tipificada) con media cero y de varianza y
desviacin estndar 1.
A estas variables se les representa por la letra Z

Tipificacin y estandarizacin de variables aleatorias


Claudia Guerrero Seplveda

Comparacin entre los valores de dos distribuciones distintas


Queremos comparar valores de distintas distribuciones, cmo sera el caso de las notas que se
obtienen en por ejemplo matemticas con dos profesores distintos.
Alumno
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Medida
Desv. Est

Calificacin
8
8
10
7
7
8
9
9
6
6
7
5
5
6
5
7
7
7
8
5

Valor Z

Alumno

0.70710678

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

0.70710678
2.12132034
0
0
0.70710678
1.41421356
1.41421356
-0.70710678
-0.70710678
0
-1.41421356
-1.41421356
-0.70710678
-1.41421356
0
0
0
0.70710678

Calificacin
8
7
7
6
9
8
9
5
9
8
9
9
7
8
8
9
8
9
7

Valor Z
0.09407209
-0.79961274
-0.79961274
-1.69329756
0.98775691
0.09407209
0.98775691
-2.58698239
0.98775691
0.09407209
0.98775691
0.98775691
-0.79961274
0.09407209
0.09407209
0.98775691
0.09407209
0.98775691
-0.79961274

-1.41421356

7
1.41421356

Medida
Desv. Est

7.89473684
1.11896272

Con el profesor A la media es 7 mientras que quienes obtienen 7 estn a .799 desviaciones
estndar de la media.
El valor Z es el nmero de desviaciones estndar a la izquierda o a la derecha
Con el profesor B quien obtiene un cinco est a -2.58 desviaciones estndar de la media
Conversin entre dos maestros.
Un 8 del profesor A equivale a un X del profesor B

zi =

xi x

zi + x = xi

8 con el profesor A es igual a una Z=0.70710678


Una Z=0.70710678 del profesor B equivale a

Tipificacin y estandarizacin de variables aleatorias


Claudia Guerrero Seplveda

0.70710678*1.1189 + 7.894 = 8.6859


Alumno
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Medida
Desv. Est

Calificacin
8
8
10
7
7
8
9
9
6
6
7
5
5
6
5
7
7
7
8
5
7
1.41421356

Valor Z
0.70710678
0.70710678
2.12132034
0
0
0.70710678
1.41421356
1.41421356
-0.70710678
-0.70710678
0
-1.41421356
-1.41421356
-0.70710678
-1.41421356
0
0
0
0.70710678
-1.41421356

Otro profesor
9
9
10
8
8
9
9
9
7
7
8
6
6
7
6
8
8
8
9
6

Alumno
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

Medida
Desv. Est

Calificacin
8
7
7
6
9
8
9
5
9
8
9
9
7
8
8
9
8
9
7

Valor Z
0.09407209
-0.79961274
-0.79961274
-1.69329756
0.98775691
0.09407209
0.98775691
-2.58698239
0.98775691
0.09407209
0.98775691
0.98775691
-0.79961274
0.09407209
0.09407209
0.98775691
0.09407209
0.98775691
-0.79961274

Otro profesor
7
6
6
5
8
7
8
3
8
7
8
8
6
7
7
8
7
8
6

7.89473684
1.11896272

En este proceso se homogeneizaron las dos distribuciones, eliminando las caractersticas propias y
reducindolas a un nico patrn.

Tipificacin y estandarizacin de variables aleatorias


Claudia Guerrero Seplveda

Los valores de variables individuos


La variable que ha sido tipificada expresa el nmero de desviaciones tpicas que difiere de la
media, as es que en un mismo individuo se pude expresar el nmero de las desviaciones tpicas
que difiere de la media en las diferentes variables y unidades de medida.
Por ejemplo la paciente sealada en verde tiene todos sus valores arriba de la media, a excepcin
del peso en el que est bajo de la media. La presin diastlica est a 2.85 desv. Estndar de la
media.
Media
Desv

45.00
3.12

Edad Zedad
45
0.00
48
0.96
40
-1.60
42
-0.96
45
0.00
49
1.28
50
1.60
43
-0.64
46
0.32
48
0.96
41
-1.28
45
0.00
45
0.00
43
-0.64
44
-0.32
42
-0.96
42
-0.96
49
1.28
47
0.64
45
0.00
49
1.28
41
-1.28
46
0.32
50
1.60

121.64
16.66

Sexo
Femenino
Femenino
Masculino
Masculino
Femenino
Femenino
Femenino
Masculino
Femenino
Masculino
Femenino
Femenino
Masculino
Masculino
Femenino
Femenino
Femenino
Masculino
Femenino
Masculino
Femenino
Femenino
Masculino
Masculino

81.59
9.97

64.88
285.11

68.58
2.49

73.77
9.47

presi
Zpresi n
Zpresin
ataque
presin n
diast diastlic colester Zcoleste
(0,no
sistlica sistlica lica
a
ol
rol
altura IN Zaltura peso
Zpeso
1,si)
Est.Salud
124.00
0.14
80
-0.16
254
0.66
70
0.57
86.18
1.31
0 Bueno
110.00
-0.70
70
-1.16
240
0.61
73
1.78
97.98
2.56
0 Bueno
114.00
-0.46
80
-0.16
279
0.75
68
-0.23
80.74
0.74
0 Regular
100.00
-1.30
80
-0.16
284
0.77
68
-0.23
67.59
-0.65
0 Bueno
190.00
4.10
110
2.85
315
0.88
68
-0.23
82.55
0.93
1 Bueno
130.00
0.50
88
0.64
250
0.65
70
0.57
83.91
1.07
0 Muy Malo
130.00
0.50
94
1.24
298
0.82
68
-0.23
73.03
-0.08
0 Excelente
110.00
-0.70
74
-0.76
384
1.12
67
-0.63
79.38
0.59
0 Malo
120.00
-0.10
80
-0.16
310
0.86
66
-1.03
65.32
-0.89
0 Malo
120.00
-0.10
80
-0.16
337
0.95
67
-0.63
58.97
-1.56
0 Excelente
130.00
0.50
80
-0.16
367
1.06
69
0.17
73.48
-0.03
0 Excelente
120.00
-0.10
90
0.84
273
0.73
68
-0.23
79.38
0.59
0 Regular
130.00
0.50
75
-0.66
273
0.73
66
-1.03
70.31
-0.37
0 Bueno
120.00
-0.10
80
-0.16
314
0.87
74
2.18
70.76
-0.32
0 Muy Malo
115.00
-0.40
70
-1.16
243
0.62
65
-1.44
68.49
-0.56
0 Excelente
140.00
1.10
90
0.84
341
0.97
74
2.18
76.20
0.26
0 Excelente
138.00
0.98
80
-0.16
245
0.63
70
0.57
83.91
1.07
0 Bueno
115.00
-0.40
82
0.04
302
0.83
69
0.17
70.36
-0.36
0 Excelente
148.00
1.58
110
2.85
302
0.83
69
0.17
68.12
-0.60
1 Excelente
120.00
-0.10
70
-1.16
386
1.13
66
-1.03
66.22
-0.80
0 Muy Malo
110.00
-0.70
70
-1.16
312
0.87
71
0.97
77.11
0.35
1 Regular
132.00
0.62
90
0.84
302
0.83
69
0.17
73.03
-0.08
0 Malo
112.00
-0.58
80
-0.16
394
1.15
69
0.17
75.75
0.21
0 Muy Malo
114.00
-0.46
70
-1.16
358
1.03
69
0.17
89.81
1.69
0 Malo

Tipificacin y estandarizacin de variables aleatorias


Claudia Guerrero Seplveda

Reconocimiento de valores atpicos o dentro de ciertos valores de


frecuencia de acuerdo a la regla emprica
La mayora de experimentos con los que nos encontramos, cumplen a grandes rasgos un
comportamiento que por lo pronto llamaremos normal.
Si se miden los estudiantes de una universidad ser probable que encontremos un buen nmero
de estaturas alrededor de 1.75, habr pocos arriba de 1.80 y prcticamente a nadie de 2.0 ms o de
1.40
Hay muchas variables que cumplen este tipo de comportamiento en forma de campana, siendo
esta distribucin bsica en los estudios estadsticos.
Una de sus caractersticas es que la mayor parte de sus observaciones se acumula alrededor de la
media y decrece en forma simtrica cuando nos alejamos de la media

La forma de esta campana depender de lo concentradas que estn las observaciones en torno a
su media, concentracin (dispersin) que vendr dada por la varianza, esta caracterstica se
resume en la siguiente regla emprica:

media desviaciones estndar (s) contiene aproximadamente 68% de las observaciones.


media 2 desviaciones estndar (s) contiene aproximadamente 95% de las observaciones.
media 3 desviaciones estndar (s) contiene casi todas las observaciones. 99.7 % de las

Tipificacin y estandarizacin de variables aleatorias


Claudia Guerrero Seplveda
Observaciones
La regla emprica alrededor de la normal trata entonces de una estimacin del % que se encuentra
alrededor de la media en funcin de las desviaciones estndar.

VALORES ATIPICOS
Se considera que todos los valores a ms menos 3 desviaciones estndar son valores atpicos
El caso de la paciente sealada en rojo muestra un comportamiento ms all de las tres
desviaciones estndar por lo que sugiere una nueva medicin, tomar un medicamento o una visita
mdica.
Media
Desv

45.00
3.12

Edad Zedad
45
0.00
48
0.96
40
-1.60
42
-0.96
45
0.00
49
1.28
50
1.60
43
-0.64
46
0.32
48
0.96
41
-1.28
45
0.00
45
0.00
43
-0.64
44
-0.32
42
-0.96
42
-0.96
49
1.28
47
0.64
45
0.00
49
1.28
41
-1.28
46
0.32
50
1.60

121.64
16.66

Sexo
Femenino
Femenino
Masculino
Masculino
Femenino
Femenino
Femenino
Masculino
Femenino
Masculino
Femenino
Femenino
Masculino
Masculino
Femenino
Femenino
Femenino
Masculino
Femenino
Masculino
Femenino
Femenino
Masculino
Masculino

81.59
9.97

64.88
285.11

68.58
2.49

73.77
9.47

presi
Zpresi n
Zpresin
ataque
presin n
diast diastlic colester Zcoleste
(0,no
sistlica sistlica lica
a
ol
rol
altura IN Zaltura peso
Zpeso
1,si)
Est.Salud
124.00
0.14
80
-0.16
254
0.66
70
0.57
86.18
1.31
0 Bueno
110.00
-0.70
70
-1.16
240
0.61
73
1.78
97.98
2.56
0 Bueno
114.00
-0.46
80
-0.16
279
0.75
68
-0.23
80.74
0.74
0 Regular
100.00
-1.30
80
-0.16
284
0.77
68
-0.23
67.59
-0.65
0 Bueno
190.00
4.10
110
2.85
315
0.88
68
-0.23
82.55
0.93
1 Bueno
130.00
0.50
88
0.64
250
0.65
70
0.57
83.91
1.07
0 Muy Malo
130.00
0.50
94
1.24
298
0.82
68
-0.23
73.03
-0.08
0 Excelente
110.00
-0.70
74
-0.76
384
1.12
67
-0.63
79.38
0.59
0 Malo
120.00
-0.10
80
-0.16
310
0.86
66
-1.03
65.32
-0.89
0 Malo
120.00
-0.10
80
-0.16
337
0.95
67
-0.63
58.97
-1.56
0 Excelente
130.00
0.50
80
-0.16
367
1.06
69
0.17
73.48
-0.03
0 Excelente
120.00
-0.10
90
0.84
273
0.73
68
-0.23
79.38
0.59
0 Regular
130.00
0.50
75
-0.66
273
0.73
66
-1.03
70.31
-0.37
0 Bueno
120.00
-0.10
80
-0.16
314
0.87
74
2.18
70.76
-0.32
0 Muy Malo
115.00
-0.40
70
-1.16
243
0.62
65
-1.44
68.49
-0.56
0 Excelente
140.00
1.10
90
0.84
341
0.97
74
2.18
76.20
0.26
0 Excelente
138.00
0.98
80
-0.16
245
0.63
70
0.57
83.91
1.07
0 Bueno
115.00
-0.40
82
0.04
302
0.83
69
0.17
70.36
-0.36
0 Excelente
148.00
1.58
110
2.85
302
0.83
69
0.17
68.12
-0.60
1 Excelente
120.00
-0.10
70
-1.16
386
1.13
66
-1.03
66.22
-0.80
0 Muy Malo
110.00
-0.70
70
-1.16
312
0.87
71
0.97
77.11
0.35
1 Regular
132.00
0.62
90
0.84
302
0.83
69
0.17
73.03
-0.08
0 Malo
112.00
-0.58
80
-0.16
394
1.15
69
0.17
75.75
0.21
0 Muy Malo
114.00
-0.46
70
-1.16
358
1.03
69
0.17
89.81
1.69
0 Malo