Sei sulla pagina 1di 9

ANALISIS DESCRIPTIVO Y REPRESENTACION

DE DATOS EN DOS VARIABLES


DATOS EN DOS VARIABLES
Estos datos consisten de los valores de dos variables diferentes
que se obtienen del mismo elemento de la poblacin. Cada una
de las variables puede ser de naturaleza cualitativa o
cuantitativa. Como resultado los datos bivariados pueden
formarse mediante tres combinaciones de variables.
Ambas variables son cualitativas (de atributo)

Gnero y especializacin de 30 estudiantes universitarios


Apellido

Gnero

Especializacin

Adams
Argento
Baker
Bennett
Brock
Brand
Chun
Crain
Cross
Ellis
Feeney
Flanigan
Hodge
Holmes
Jopson

M
F
M
F
M
M
F
M
F
F
M
M
F
M
F

FyL
AE
FyL
FyL
AE
T
FyL
T
FyL
FyL
T
AE
AE
T
T

Apellido

Kee
Kleeberg
Light
Linton
Lopez
McGowan
Mowers
Ornt
Palmer
Pullen
Rattan
Sherman
Small
Tate
Yamamoto

Gnero

Especializaci
n

M
M
M
F
M
M
F
M
F
M
M
F
F
M
M

AE
FyL
FyL
FyL
T
AE
AE
T
AE
T
AE
AE
T
AE
FyL

Procedimiento con SPSS para tabla cruzada


Luego de nombrar variables como gnero y especializacin; poner en string ambas variables.
1. Analyze, descriptive statistics, crosstab
2. Mover variables, ok
3. Si se desean por cientos, marcar cells y ah porcentajes

La informacin de dos variables cualitativas se resume con una


Tabla cruzada (o de contingencia) de gnero y especializacin.
G

N
E
R
O

Especializacin
Filosofa y Letras
Masculino
Femenino
Total

5
6
11

Adm. de
Empresas

Tecnologa

TOTAL

6
4
10

7
2
9

18
12
30

Tabla Cruzada de gnero y especializacin. Porcentajes basados


en el gran total
G

N
E
R
O

Especializacin
Filosofa y Letras
Masculino
Femenino
Total

17%
20%
37%

Adm. de
Empresas

Tecnologa

TOTAL

20%
13%
33%

23%
7%
30%

60%
40%
100%

Tabla Cruzada de gnero y especializacin Porcentajes basados


en los totales por rengln
G

N
E
R
O

Especializacin
Filosofa y Letras
Masculino 5/18 28%
Femenino
50%
Total
37%

Adm. de
Empresas

Tecnologa

TOTAL

33%
33%
33%

39%
17%
30%

100%
100%
100%

Tabla Cruzada de gnero y especializacin Porcentajes basados


en los totales por columna

N
E
R
O

Especializacin
Filosofa y Letras
Masculino 5/11 45%
Femenino
55%
Total
100%

Adm. de
Empresas

Tecnologa

TOTAL

60%
40%
100%

78%
22%
100%

60%
40%
100%

Adems de ayudar a establecer porcentajes, cuando se trabaja


con 2 variables cualitativas podemos analizar si las variables son
dependientes. Esto se hace:
Luego de nombrar variables como gnero y especializacin; poner en string ambas variables.
1. Analyze, descriptive statistics, crosstab
2. Mover variables, ir a statistics ( se marca la chi square )
3. Entonces si el valor al lado de significancia en el renglon de Pearson chi square test
,es menor que el error establecido por el investigador se dice que las variables son
dependientes

Una Variable cualitativa y otra cuantitativa


Cuando los datos bivariados se obtienen de una variable
cualitativa y otra cuantitativa, los valores cuantitativos se
consideran como muestras ajenas, cada una identificada por los
niveles de la variable cualitativa. Los resultados se presentan uno
junto al otro para efectos de comparacin.
Ejemplo
Para comparar la capacidad de frenado de tres diseos de
gomas, se midi la distancia necesaria para detener un automvil
de 3,000 libras que se desplazaba sobre pavimento hmedo. Los
neumticos de cada diseo fueron probados en el mismo
vehculo que circulaba sobre un pavimento hmedo controlado.

Diseo
37
34
38

A
36
40
32

Diseo
33
34
38

B
35
42
34

Diseo
40
41
40

C
39
41
43

El diseo de la banda de rodamiento es una variable cualitativa


con tres niveles de respuestas y la distancia de frenado es una
variable cuantitativa. El anlisis de estas variables se hace con lo
que se llama Resumen de cinco puntos. Estos cinco puntos son
medidas: Cuartiles, mximo y mnimo.
Resumen de cinco puntos para cada diseo:

Mximo
Q3
Mediana
Q1
Mnimo

Media
Desviacin
estndar

Diseo A

Diseo B

Diseo C

40
38.5
36.5
33.5
32

42
38
34.5
34
33

43
41
40.5
40
39

Diseo B
36.0
3.4

Diseo C
40.7
1.4

Diseo A
36.2
2.9

Estos cinco puntos se pueden representar grficamente mediante


un boxplot.
Procedimiento para hacer el boxplot.
Luego de nombrar la variable y entrar los datos:
1. Ir al men graphs
2. Seleccionar boxplot
3. Marcar simple, summaries of separate variables, define
4. Mover las variables, ok

Dos variables cuantitativas


Cuando los datos bivariados son resultados de dos variables
cuantitativas, los datos matemticos suelen expresarse como
pares ordenados (x, y), donde x es la variable independiente, y es
la variable dependiente.
Se dice que los datos estn ordenados porque siempre se
escribe primero un valor, x, y se explica que estn pareados
porque para cada valor de x existe un valor y correspondiente
que proviene de la misma fuente. En los problemas en que
intervienen dos variables cuantitativas, los datos de la muestra
se presentan grficamente en un diagrama de dispersin.
Un diagrama de dispersin es la grfica de todos los pares
ordenados de datos de dos variables que estn en un sistema de
ejes coordenados. La variable independiente, x, se grafica en el
eje horizontal y la variable dependiente, y, se grafica en el eje
vertical.
Ejemplo
En una clase de Educacin Fsica, se tomaron varios
puntajes de condicin fsica.
Estudiante
Lagartijas
(x)
Sentadillas
(y)

10

27

22

15

35

30

52

35

55

40

40

30

26

25

42

38

40

32

54

50

43

Procedimiento para hacer diagrama de dispersin


1. Nombrar variables y entrar datos
2. Usar el men graphs, scatter, simple, define.
3. Escribir el ttulo
4. Mover variables, ok

DIAGRAMA DE DISPERSION

SENTADILLAS

60
50
40
30

Series1

20
10
0
0

20

40

60

LAGARTIJAS

Correlacin Lineal
El objetivo primordial del anlisis de correlacin lineal es medir la
intensidad de una relacin lineal entre dos variables. Si a medida
que crece x no hay un cambio definido en los valores de y, se
dice que no hay correlacin entre los valores entre x y y.
Si a medida que crece x , hay un cambio en los valores de y ,
entonces existe una correlacin. La correlacin es positiva
cuando y tiende a crecer y es negativa cuando y tiende a
decrecer, a medida que x aumenta. Si los pares (x,y) tienden a
seguir un patrn de lnea recta, se tiene una correlacin lineal.
1. La Correlacin positiva perfecta ocurre cuando los
puntos en el diagrama de dispersin estn todos en
una lnea recta. Aqu la correlacin es positiva.
2. La correlacin negativa perfecta es semejante, pero
con correlacin negativa.
3. Si los puntos en el diagrama de dispersin forman una
recta horizontal o vertical, no hay correlacin.

4. Correlacin no es lineal cuando los puntos en el


diagrama de dispersin no estn cerca de una recta.
5. El coeficiente de correlacin lineal, r, es la medida
numrica de la intensidad de la relacin lineal entre dos
variables.
1 < r < 1.
Un valor de 1 significa una correlacin
positiva perfecta y r = 1, una correlacin
negativa perfecta. r es negativo, si la
correlacin es negativa y r es positivo si la
correlacin es positiva.
r=

XY
2

X 2 X

X Y

Y
-

Procedimiento para Coeficiente de correlacin lineal (r)


1. men analyze, correlate, bivariate
2. Mover variables, ok
3. Si el valor de la significancia para dos colas es menor que el error
establecido por el investigador, se dice que hay correlacin lineal
significativa.

REGRESION LINEAL (Anlisis de regresin)


El coeficiente de correlacin lineal (r) mide la intensidad de una
relacin lineal, pero no dice nada sobre la relacin matemtica
que hay entre las dos variables. No ayuda a predecir. El anlisis
de regresin encuentra la ecuacin de la recta que describe
mejor la relacin entre dos variables. Una aplicacin de esta
ecuacin es hacer predicciones. En general, el valor exacto de y
no es predecible, sin embargo, las aproximaciones a este valor
son de utilidad si las predicciones son razonablemente acertadas.
La relacin entre estas dos variables es una ecuacin algebraica.
Lineal: y = b0 + b1x
7

La ecuacin de la recta del mejor ajuste es determinada por su pendiente


(b1) y la interseccin con el eje y (b0).

Pendiente: b1 =

XY

X Y

N
2

X 2 X

Interseccin en y : b0 =

Y b1 * X
n

Procedimiento para ecuacin de la recta de mejor ajuste


1. men analyze, regresin, linear
2. mover variables, ok
3. En el output, leer bajo coefficients y en la columna de B.
El valor al lado de la variable es b1 y el valos al lado de constante es b0
4. Sustituir en la frmula de la ecuacin: y = b0 + b1x.

Nota: Estos valores de b tambin se pueden hallar en otra


opcin. Se puede hacer el diagrama de dispersin y la recta de
mejor ajuste en la misma grfica. Para hacer esto usar el
procedimiento anterior con la opcin curve estimation.
Hacer predicciones
Predecir es hallar el valor de y, con la ecuacin de mejor
ajuste, dado un valor de x o hallar un valor de x dado un
valor de y.
Ejemplo: Si la ecuacin de mejor ajuste es
y = 1.861 + 1.317x ,y se desea predecir el valor de y
cuando x = 5.6:
y = 1.861 + 1.317(5.6) = 9.24 .
Si

y = 6.9 , predecir el valor de x .

6.9 = 1.861 + 1.317 x;


6.9 - 1.861 = 1.317x;

5.039 = 1.317x ;
5.039/1.317 = x ; x = 3.83

NOTA: PARA PODER PREDECIR LOS VALORES TIENEN


QUE ESTAR DENTRO DE LOS LMITES DE LA MUAETRA
Practica
LAGARTIJAS
(X)

SENTADILLAS
(Y)

X2

Y2

XY

27
22
15
35
30
52
35
55
40
40
351

30
26
25
42
38
40
32
54
50
43
380

729
484
225
1225
900
2704
1225
3025
1600
1600
13717

900
676
625
1764
1444
1600
1024
2916
2500
1849
15298

810
572
375
1470
1140
2080
1120
2970
2000
1720
14257

Y
Y N

= 1396.9

= 858

X Y
XY N = 919
2

X 2 X

R = (919
b1 =
b0 =

Y
-

= 1094.779

/ 1094.779) = 0.839439
0.657885
1.010036

Y 1.010036 + 0.657885 ( X ) verificarlo

con SPSS
9

Potrebbero piacerti anche