Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADÍSTICA
SEMANA 5
Estadística bivariada
Todos los derechos de autor son de la exclusiva propiedad de IACC o de los otorgantes de sus licencias. No está
permitido copiar, reproducir, reeditar, descargar, publicar, emitir, difundir, poner a disposición del público ni
utilizar los contenidos para fines comerciales de ninguna clase.
IACC
1
SEMANA 5– ESTADÍSTICA
APRENDIZAJE ESPERADO
El estudiante será capaz de analizar
ejercicios y problemas de estadística
bivariada usando procedimientos de
relacionamiento de variables.
IACC
2
SEMANA 5– ESTADÍSTICA
APRENDIZAJE ESPERADO..................................................................................................................... 2
INTRODUCCIÓN ................................................................................................................................... 4
1. TABLAS DE FRECUENCIAS BIVARIADAS ....................................................................................... 5
2. ¿CÓMO SE RELACIONAN LAS VARIABLES? ................................................................................ 10
2.1. COVARIANZA ..................................................................................................................... 10
2.2. COEFICIENTE DE CORRELACIÓN ........................................................................................ 12
2.3. COEFICIENTE DE DETERMINACIÓN ................................................................................... 15
3. ESTADÍSTICA BIVARIADA CON EXCEL ........................................................................................ 16
COMENTARIO FINAL.......................................................................................................................... 20
REFERENCIAS ..................................................................................................................................... 21
IACC
3
SEMANA 5– ESTADÍSTICA
INTRODUCCIÓN
En las aplicaciones de la estadística hay - ¿Existe alguna relación entre la estatura y
muchos problemas que requieren un análisis el peso?
combinado de dos variables. En las siguientes
áreas: administración, en educación y en - Los médicos prueban fármacos nuevos
muchas otras materias, a menudo es para combatir la fiebre amarilla, al
necesario contestar preguntas como: “¿Están prescribir dosis diferentes y observar las
relacionadas estas dos variables? Si es así, respuestas de sus pacientes.
¿de qué manera? ¿Existe una correlación
entre las variables?”. Considere los
siguientes ejemplos:
IACC
4
SEMANA 5– ESTADÍSTICA
En donde:
IACC
5
SEMANA 5– ESTADÍSTICA
Ejemplo 1:
Si se quiere calcular el “promedio de edad de las personas que estudiaron 14 años”, se transforma
en un problema de una sola variable:
Como la variable es continua (se debe considerar la marca de clase de la variable edad), el tiempo
promedio es:
20 2 24 1 28 2
Tiempo
5
Cabe destacar que el total de individuos es 5, ya que son ellos los que cumplen la condición de
estudiar 14 años y que 2 tienen 20 años, 1 tiene 24 y 2, 28 años, entonces:
20 2 24 1 28 2 40 24 56 120
Tiempo 24
5 5 5
Ejemplo 2:
Se desea estudiar el promedio de “años de estudio”, pero solo de aquellas personas menores de
26 años:
IACC
6
SEMANA 5– ESTADÍSTICA
Luego, se tiene:
12 7 13 1 14 3 15 3 84 13 42 45 184
Años 13,14
14 14 14
Así, el promedio de años de estudio para los menores de 26 años es de aproximadamente 13 años.
Ejemplo 3:
IACC
7
SEMANA 5– ESTADÍSTICA
Solución:
El número de matrimonios que cumplen con la condición de edad (entre 20 y 30) son:
Es decir:
35 + 7 + 3 + 14 = 59
b) “A lo más 35 años” significa que la edad de los maridos es menor o igual a dicho número.
Entonces, el grupo que se debe evaluar es:
Así, se puede escribir la tabla de la siguiente manera. Recordar que la marca de clases es
calcular los extremos dividido por dos, es decir y tomando como ejemplo el primer intervalo, se
tiene (20 + 25)/2 = 45/2 = 22,5.
IACC
8
SEMANA 5– ESTADÍSTICA
2.500
YX 35 27,174
92
Por lo tanto, la media de la edad de las mujeres cuyos maridos tienen a lo más 35 años es de 27
años aproximadamente.
c) Finalmente, para determinar cuál rango de edad de los maridos es más homogéneo, hay que
calcular el coeficiente de variación para las siguientes tablas:
Luego:
935 22.100
X 20Y 25 23,375 . 23,375 2 6,11 2,47
40 40
2,47
CV ( X 20Y 25 ) 0,1057 10,57%
23,375
IACC
9
SEMANA 5– ESTADÍSTICA
Marca de
Clase X(años) N° matrimonios Mc*N°matri Mc^2*N°matrim
22,5 20 - 25 1 22,5 506,3
27,5 25 - 30 3 82,5 2.268,8
32,5 30 - 35 2 65 2.112,5
37,5 35 - 40 1 37,5 1.406,3
207,5 6.293,8
Luego:
207,5
X 35Y 40 29,642
7
6.293,8
29,642 2 20,46 4,523
7
4,523
CV ( X 35Y 40 ) 0,1526 15,26%
29,642
Por lo tanto el grupo más homogéneo son los matrimonios cuya edad de la mujer es menor a
25 años, ya que su coeficiente de variación es menor.
2.1. COVARIANZA
La covarianza entre dos variables es una medida estadística para determinar el tipo de relación
entre dichas variables. Se la identificará como: S xy
S xy XY X Y
IACC
10
SEMANA 5– ESTADÍSTICA
Observaciones:
Ejemplo:
Una empresa desea estudiar la relación entre la edad de sus trabajadores y los días no trabajados.
Considerar:
X = edad.
Y = N° de días no trabajados.
IACC
11
SEMANA 5– ESTADÍSTICA
De este modo:
3 16 9 16 15 15 417
Dias 8,8723
47 47
0 810 337,5 990 1485 0 315 1260 3150 135 810 5400
Edad Días 312,61
47
Entonces, se puede concluir que la relación es directa, pues, si la edad de los trabajadores
aumenta, los días no trabajados también.
IACC
12
SEMANA 5– ESTADÍSTICA
Este coeficiente se aplica cuando la relación que puede existir entre las variables es lineal (es decir,
si se representara en un gráfico los pares de valores de las dos variables, la nube de puntos se
aproximaría a una recta). No obstante, puede que exista una relación que no sea lineal, sino
exponencial, parabólica, etc. En estos casos, el coeficiente de correlación lineal no mediría
correctamente la intensidad de la relación de las variables, por lo que convendría utilizar otro tipo
de coeficiente más apropiado.
S
xy
rxy
S S
x y
Observaciones:
Si r 1
xy
Si r 1
xy
IACC
13
SEMANA 5– ESTADÍSTICA
Si r 0
xy
Ejemplo:
X = N de trabajadores.
Y = utilidades (en millones de $).
N° de Utilidades
trabajadores (en millones de $)
1–4 4–8 8 – 12 ni MCi
0 – 100 12 / 1.500 6 / 1.800 0/0 18 50
100 – 200 6 / 2.250 3 / 2.700 1 / 1.500 10 150
200 – 300 4 / 2.500 5 / 7.500 3 / 7.500 12 250
300 – 400 0/0 6 / 12.600 10 / 35.000 16 350
nj 22 20 14 N 56
MC j 2,5 6 10
IACC
14
SEMANA 5– ESTADÍSTICA
Por lo tanto:
S XY X Y S 1.336 ,607 196 ,428 5,625
xy xy
S 231,6995
xy
Entonces la covarianza indica que existe relación directa entre el número de trabajadores y las
utilidades de las empresas, es decir, a mayor número de trabajadores, mayor cantidad de
utilidades).
2.257 ,5 315 2
s 8,672 2,945
y 56 56
231,6995
r 0,65
xy 120 ,955 2,945
El coeficiente de correlación indica que existe relación lineal entre el número de trabajadores y las
utilidades, con pendiente positiva.
IACC
15
SEMANA 5– ESTADÍSTICA
2
S
2 xy
rxy
S x S y
231,6995
rxy 0,65
120 ,955 2,945
231,6995
rxy ( ) 2 0,42
120 ,955 2,945
Luego, el coeficiente de determinación indica que el 42% de las utilidades son influenciadas por la
cantidad de trabajadores o que el 42% de los trabajadores tiene influencias sobre las utilidades.
Ejemplo 1:
Construir una tabla que cuente los datos clasificados por rango de estatura y nivel
socioeconómico.
a) ¿Cuántas personas tienen una estatura sobre 161 cm y hasta 179 cm?
b) ¿Cuántas personas tienen una estatura de a lo más 170 cm y poseen un nivel socioeconómico
bajo o medio?
d) De las personas que tienen una estatura desde 152 cm y hasta 170 cm, ¿qué porcentaje poseen
un nivel socioeconómico bajo?
IACC
16
SEMANA 5– ESTADÍSTICA
Solución:
Para desarrollar este ejercicio, se debe construir una tabla dinámica que presente las variables
descritas, esto es:
a) ¿Cuántas personas tienen una estatura sobre 161 cm y hasta 179 cm?
Para resolver esto, se debe filtrar la variable Rango Estatura según la o las filas que se deban
ocupar:
Entonces, hay 272 personas que tienen una estatura sobre 161 cm y hasta 179 cm.
b) Para saber ¿cuántas personas tienen una estatura de a lo más 170 cm y poseen un nivel
socioeconómico bajo o medio?
Hay 356 personas que miden a lo más 170 cm y son de nivel socioeconómico bajo o medio.
Al realizar los filtros se ordenan los datos como porcentaje del total:
Cuenta de ID Nivel socioeconómico
Rango Estatura Bajo Medio Alto Total general
152 - 161 11,80% 24,40% 9,40% 45,60%
161 - 170 11,20% 23,80% 8,00% 43,00%
170 - 179 2,20% 5,00% 4,20% 11,40%
Total general 25,20% 53,20% 21,60% 100,00%
Por tanto, el 74,8% (53,2% + 21,6%) de las personas son de nivel socioeconómico medio o alto.
IACC
17
SEMANA 5– ESTADÍSTICA
d) Y de las personas que tienen una estatura desde 152 cm y hasta 170 cm, ¿qué porcentaje
poseen un nivel socioeconómico bajo?
Al realizar los filtros se ordenan los datos como porcentaje del total:
Entonces el resultado arroja que el 25,96% de los que miden desde 152 cm y hasta 170 cm,
tienen un nivel socioeconómico bajo.
Ejemplo 2:
Construir una tabla que cuente con los datos clasificados por rango de peso y rango de estatura.
a) ¿Cuántas personas pesan entre 51,3 y 59,9 kg y miden entre 170 y 179 cm?
b) De las personas que miden a lo más 170 cm, ¿qué porcentaje pesa más de 68,5 kg?
Solución:
a) La primera pregunta es ¿cuántas personas pesan entre 51,3 y 59,9 kg y miden entre 170 y 179
cm?
Se obtiene que:
Entonces, no hay personas que pesan entre 51,3 y 59,9 kg, y que midan entre 170 y 179 cm.
IACC
18
SEMANA 5– ESTADÍSTICA
Para calcular la covarianza y coeficiente de correlación se debe digitar las siguientes fórmulas:
Covarianza:
=COVAR(DATOS_DE_X ; DATOS_DE_Y)
Coeficiente de correlación:
=COEF.DE.CORREL(DATOS_DE_X; DATOS_DE_Y)
IACC
19
SEMANA 5– ESTADÍSTICA
COMENTARIO FINAL
En esta semana se aprendió como introducción el estudio de la estadística bivariada, ya
que es el comienzo de las aplicaciones más comunes de esta área en, por ejemplo,
medicina, psicología, y especialmente en economía y econometría. Sin lugar a dudas, estas
áreas serán beneficiadas con estos conocimientos y herramientas estadísticas aplicadas en
la vida del futuro profesional, que no solo las necesitará, sino que sacará mucho provecho
en su diario quehacer al obtener valiosos resultados inapelables.
IACC
20
SEMANA 5– ESTADÍSTICA
REFERENCIAS
Anderson, D.; Sweeney, D. y Williams, T. (2008). Estadística para administración y economía, 10ª
Thomson Editores.
Levin, R.; Rubin, D.; Balderas, M.; Del Valle, J. C. y Gómez, R. (2004). Estadística para
IACC
21
SEMANA 5– ESTADÍSTICA
IACC
22
SEMANA 5– ESTADÍSTICA
IACC
23
SEMANA 5– ESTADÍSTICA
IACC
24