Sei sulla pagina 1di 19

Captulo 2

Estadstica Descriptiva Bidimensional


Hasta ahora hemos estudiado sobre cada individuo de una poblacin el comportamiento de una variable X . En ocasiones se est interesado en el estudio simultneo de dos (o ms) variables, X e Y, con el n de observar una posible relacin entre ellas.

2.1.

Distribucin de frecuencias bidimensional. Tabla de doble entrada.

Consideremos una poblacin de N individuos sobre los que medimos conjuntamente dos variables, X e Y. Cada individuo vendr dado entonces por un par de valores (xi , yi ), i = 1, ..., N. Al igual que en el caso unidimensional, debemos buscar una forma organizada de presentar las observaciones. Esto se consigue con las tablas de doble entrada. Supongamos que la variable X presenta k valores distintos, x1 , ..., xk , y la variable Y presenta p valores distintos, y1 , ..., yp . La tabla de doble entrada se construye de la siguiente forma: 27

28 Tabla 2.1: Tabla de doble entrada

Captulo 2. Estadstica Descriptiva Bidimensional

X \Y x1 . . . xi . . . xk

y1 n11

yj n1j

yp n1p n1.

ni1

nij

nip

ni. ,

nk1 n,1

nkj n.j

nkp n.p

nk. N

donde nij es la frecuencia absoluta del par (xi , yj ), es decir, el nmero de individuos que presentan el valor xi en X e yj en Y. La frecuencia relativa correspondiente, fij , se calcula sin ms que dividir la frecuencia absoluta por el total de observaciones, N,

fij =

nij N

Claramente,

p k X X i=1 j =1

nij

= N,

p k X X i=1 j =1

fij

= 1.

Ejemplo 2.1: 20 alumnos de la asignatura de Mtodos Estadsticos se asignan los siguientes

2.1. Distribucin de frecuencias bidimensional. Tabla de doble entrada.

29

grados -de 1 a 10- de atractivo personal (GAPER) e inteligencia (GINTE),

Individuo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

GINTE 6 7 8 7 8 6 8 6 7 4 6 6 5 7 5 5 5 8 6 5

GAPER 6 8 8 8 9 7 10 6 8 5 5 4 3 7 8 5 2 9 5 5

La tabla de doble entrada queda de la siguiente forma: Delia Montoro Cazorla. Dpto. de Estadstica e I.O. Universidad de Jan.

30

Captulo 2. Estadstica Descriptiva Bidimensional

Tabla 2.2 GINTE\GAPER 4 5 6 7 8 2 0 1 0 0 0 1 3 0 1 0 0 0 1 4 0 0 1 1 0 2 5 1 2 2 0 0 5 6 0 0 2 3 0 5 7 0 0 1 0 0 1 8 0 1 0 0 1 2 9 0 0 0 0 2 2 10 0 0 0 0 1 1 1 5 6 4 4 N =20

En la tabla se observa ya una cierta relacin lineal entre ambas variables. Ejemplo 2.2. Pesos y alturas de los alumnos. ALTURA\PESO (1.55-1.65] (1.65-1.75] (1.75-1.85] (1.85-1.95] n.j (45-55] 3 (15 %) 1 1 0 5 (55-65] 1 4 (20 %) 0 0 5 (65-75] 0 3 1 1 5 (75-85] 0 1 4 0 5 ni. 4 9 (40 %) 6 1 N =20

2.2.
2.2.1.

Distribuciones marginales y condicionadas


Distribuciones marginales

Surgen al estudiar el comportamiento de cada una de las variables por separado. Distribucin marginal de la variable X : anotamos los distintos valores de la variable X junto con sus frecuencias. Denotamos por ni. el nmero de individuos que presentan el valor xi en X (independientemente del valor que presenten en Y ), ni. =
p X j =1

nij = ni1 + ... + nip,

por fi. la proporcin de individuos que presentan el valor xi , fi. = ni. N

2.2. Distribuciones marginales y condicionadas

31

Distribucin marginal de la variable Y : Anlogamente denotamos por n.j el nmero de individuos que presentan el valor yj en Y (independientemente del valor que presenten en X ), n.j =
k X i=1

nij = n1j + ... + nkj

por f.j la proporcin de individuos que presentan el valor yj , f.j = Lgicamente debe suceder que:
k X i=1

n.j N

ni.

k X i=1

p X j =1 p X j =1

n.j = N,

fi.

f.j = 1

2.2.2.

Distribuciones condicionadas

Expresan cmo se distribuye una de las variables sobre un conjunto de individuos que verican una determinada condicin en la otra variable. Distribucin de X condicionada al valor yj de Y ( X/Y = yj ) : estudia el comportamiento de la variable X sobre aquellos individuos que presentan el valor yj en Y. La tabla de frecuencias presenta la siguiente forma: X/Y = yj x1 . . . xk nij n1j . . . nkj n.j fi/j = f1/j . . . fk/j 1 nij n.j ,

donde fi/j es la proporcin de individuos que presentan el valor xi en X de entre los que presentan el valor yj en Y. Distribucin de Y condicionada al valor xi de X ( Y /X = xi ) : estudia el comportamiento de la variable Y sobre aquellos individuos que presentan el valor xi en X. La tabla de Delia Montoro Cazorla. Dpto. de Estadstica e I.O. Universidad de Jan.

32 frecuencias presenta la siguiente forma: Y /X = xi y1 . . . yp

Captulo 2. Estadstica Descriptiva Bidimensional

nij ni1 . . . nip ni.

fj/i = f1/i . . . fp/i 1

nij ni. ,

donde fj/i es la proporcin de individuos que presentan el valor yj en Y de entre los que presentan el valor xi en X. Ejemplo 2.3: Distribucin marginal de la variable GINTE (datos del ejemplo 2.1) GINTE 4 5 6 7 8 frec. abs. 1 5 6 4 4 N = 20 frec. rel. 0.05 0.25 0.3 0.2 0.2 1

Ejemplo 2.4: Estudiamos el grado de atractivo personal (GAPER) sobre aquellos individuos que se asignan un grado de inteligencia inferior o igual a 5. Los resultados son: GAPER/GINTE 5 2 3 4 5 6 7 8 frec. abs. 1 1 0 3 0 0 1 6 frec. rel. 0.16 0.16 0 0.5 0 0 0.16 1

Observamos que el 82 % de los individuos con GINTE 5 presentan un GAPER 5. Ya advertamos una clara asociacin entre valores bajos y altos de ambas variables.

2.3. Medidas de asociacin

33

2.3.

Medidas de asociacin

Segn comentbamos, uno de los motivos por los que se estudian conjuntamente dos variables es para ver si existe relacin entre ellas, pudiendo "predecir"en caso de haberla valores de una a partir de la otra. Una forma de detectar la posible relacin entre las variables es grcamente, y el grco utilizado es conocido como diagrama de dispersin o nube de puntos. Otra forma es a travs de medidas numricas tales como la covarianza o el coeciente de correlacin de Pearson. Centramos fundamentalmente nuestro inters en la asociacin de tipo lineal.

2.3.1.

Diagrama de dispersin

Se construye representando los pares de valores observados en un eje cartesiano. Proporciona una buena descripcin de la relacin existente entre las variables. Ejemplos de casos que pueden darse:
102 99 96 93 90 87 0 0,01 0,02 0,03 0,04 102 99 96 93 90 87 0,87 1,07 1,27 1,47 1,67

a)
10 8 6 4 2 0 0 2 4 6 8 10 12

b)
(X 1000) 1 0,8 0,6 0,4 0,2 0 0 2 4 6 8 10

c)

d)

En a) hay ausencia de relacin (independencia). En b) existe asociacin lineal positiva (varan en general en el mismo sentido). En c) existe asociacin lineal negativa (varan en sentido contrario). En d) existe fuerte asociacin, pero no lineal. Ejemplo 2.5: Diagrama de dispersin de (GAPER, GINTE), datos de ejemplo 2.1 Delia Montoro Cazorla. Dpto. de Estadstica e I.O. Universidad de Jan.

34

Captulo 2. Estadstica Descriptiva Bidimensional

10 8

GAPER

6 4 2 0 4 5 6 7 8

GINTE

Figura 2.1:

2.3.2.

La covarianza

Es una medida de la asociacin lineal existente entre dos variables. Resume la informacin contenida en el diagrama de dispersin. Presenta la siguiente expresin: - Datos sin tabular : x,y = - Datos tabulados: x,y = Pk
i=1

PN

i=1 (xi

x)(yi y ) = N

PN Pk

i=1

xi yi

xy

Pp

j =1

nij (xi x)(yj y ) N

i=1

Pp

j =1

nij xi yj

xy

Si la covarianza est muy prxima a cero, no existe relacin entre las variables o si existe es marcadamente no lineal, si es positiva, hay asociacin lineal positiva, y si es negativa, hay asociacin lineal negativa. Sin embargo, como la covarianza depende de las unidades de medida de las variables, no nos permite cuanticar el grado de asociacin lineal ni comparar la asociacin existente entre distintos pares de variables. Para dar solucin a este problema se obtiene el coeciente de correlacin.

2.3.3.

El coeciente de correlacin

Es una medida adimensional del grado de asociacin lineal existente entre dos variables. Se dene como: x,y = Algunas observaciones y propiedades: x,y xy

2.3. Medidas de asociacin

35

Su signo viene determinado por el de la covarianza. Indicar por tanto si la asociacin es positiva o negativa, y vale 0 cuando la covarianza vale 0 (ausencia de asociacin lineal). 1 x,y 1. Valores prximos a -1 indican fuerte asociacin lineal negativa, valores prximos a 1 indican fuerte asociacin lineal positiva, y valores prximos a 0 indican ausencia de asociacin lineal (pero puede existir otro tipo de asociacin, por ejemplo exponencial, cuadrtica, etc.) No se debe interpretar el coeciente sin haber visto previamente el diagrama de dispersin (podra por ejemplo haber algn dato atpico). Un coeciente de correlacin alto (en valor absoluto) indica que las variables toman valores relacionados entre s entre los elementos observados, pero no permite concluir la existencia de ninguna relacin de causalidad entre las variables. Por ejemplo, suponed que se estudian conjuntamente las variables X =No de matrimonios mensuales (en una ciudad) y Y ="Temperatura del mes", obtenindose un coeciente de correlacin de 0.7. Eso signica que, en efecto, suele haber ms matrimonios a medida que mejoran las temperaturas, pero esto no implica que un aumento de matrimonios aumente la temperatura del mes, ni que una ola de calor cause una avalancha de matrimonios. Ejemplo 2.6: Clculo de la covarianza y coeciente de correlacin de (GAPER, GINTE), datos de ejemplo 2.1 Media GAPER GINTE GAP ER,GIN T E = 6.4 6.25 Desv. tpica 2.083 1.178

GAP ER,GIN T E

6 6 + 7 8 + 8 8 + ... + 6 5 + 5 5 6,25 6,4 = 1,9 20 (datos sin tabular), 4 1 5 + 5 1 2 + ... + 8 2 9 + 8 1 10 = 6,25 6,4 20 = 1,9 (datos tabulados, tabla 2.2)

GAP ER,GIN T E = Delia Montoro Cazorla. Dpto.

1,9 = 0,774 2,083 1,178

de Estadstica e I.O. Universidad de Jan.

36

Captulo 2. Estadstica Descriptiva Bidimensional

La asociacin lineal entre las variables es positiva y relativamente fuerte.

2.4.

Regresin lineal. Ajuste por mnimos cuadrados.

En la seccin anterior hemos visto cmo medir la asociacin lineal entre dos variables X e Y . En caso de haber una buena asociacin lineal entre ellas, nuestro objetivo ser encontrar la mejor recta que permita predecir valores en una de las variables a partir de la otra. Hablamos de la mejor recta en el sentido de que los errores que podamos cometer al predecir sean mnimos. Este es un problema de regresin lineal. Supongamos que queremos encontrar la recta que mejor exprese el comportamiento de Y en funcin de X con el n de predecir con el mnimo error posible valores en Y para valores dados en X. La recta ser de la forma Y = aX + b, y debemos encontrar los valores de a y b. Nuestras observaciones son (xi , yj ) con frecuencias nij o fij , de forma que para un valor observado xi tenemos un valor observado yj en Y, frente a un valor y j = axi + b que predecira la recta. El error cometido en la prediccin en este caso vendra dado por eij = yj y j = yj axi b, con una frecuencia de nij o fij . El promedio de todos los errores de prediccin vendra dado por P

fij eij . Sin embargo,

esta medida no nos sirve para cuanticar el error global de prediccin, ya que errores grandes positivos y negativos podran ser compensados. Por ello se consideran los errores al cuadrado, P fij e2 ij . P Debemos encontrar a, b tal que la cantidad fij e2 ij sea mnima. De ah el nombre de ajuste por mnimos cuadrados. M in
a,b

Derivando y operando se obtiene que: a = b = de forma que Y =

fij e2 ij = M in
a,b

fij (yj axi b)2

x,y , 2 x

y ax,

x,y x,y x + ( y 2 x) 2 x x

2.4. Regresin lineal. Ajuste por mnimos cuadrados.

37

es la recta de regresin de Y sobre X . Anlogamente se obtendra la recta de regresin de X sobre Y, X= x,y x,y y + (x 2 y ) 2 y y

Una forma de medir la bondad del ajuste y por lo tanto la abilidad de las estimaciones es mediante el coeciente de determinacin, R2 = 2 , o simplemente con el coeciente de correlacin. El coeciente de determinacin R2 toma valores entre 0 y 1; cuanto ms se aproxime a 1, mayor ser la asociacin lineal entre las variables, mejor ser por lo tanto el ajuste de la recta a la nube de puntos, y mayor abilidad tendrn las predicciones. Ejemplo 2.7: Recta de regresin de GAPER sobre GINTE (datos ejemplo 2.1) GAP ER = aGIN T E + b, donde a = 1,9 = 1,369 1,1782 b = 6,4 1,369 6,25 = 2,156 GAP ER = 1,369GIN T E 2,156 Para un individuo con GINTE=9 se predice un GAPER de aproximadamente 10.

GAP ER(9) = 1,369 9 2,156 ' 10 La estimacin es able en un R2 100 % = 60 %. Ejemplo 2.8: Se desea investigar si existe relacin entre la pureza del oxgeno producido en un proceso de destilacin qumico (Y ) y el porcentaje de hidrocarburos presentes en el condensador principal de la unidad de destilacin (X ). Con este n, se obtienen las siguientes observaciones: X Y 0.99 90.01 1.02 89.05 1.15 91.43 1.29 93.74 1.46 96.73 1.36 94.45 0.87 87.59 1.23 91.77 1.55 99.12 1.40 93.65

Delia Montoro Cazorla.

Dpto.

de Estadstica e I.O. Universidad de Jan.

38

Captulo 2. Estadstica Descriptiva Bidimensional

a) Obtn una tabla de doble entrada, agrupando las variables en intervalos. X \Y (0.8-1] (1-1.2] (1.2-1.4] (1.4-1.6] n.j (87-90.75] 2 1 0 0 0 (90.75-94.5] 0 1 4 0 0 (94.5-98.25] 0 0 0 1 1 (98.25-102] 0 0 0 1 1 ni. 2 2 4 2 N =10

b) Calcula la media y desviacin tpica de cada variable, a partir del conjunto de datos original (no agrupados por intervalos). Qu variable presenta mayor dispersin entorno a su media?. Media X Y 1.232 92.773 Desv. tpica 0.2103 3.3962 Coef. variacin 0.1707 0.0366

Como el coeciente de variacin de Y es ms pequeo que el de X, la variable Y presenta datos ms concentrados entorno a su media que X. La media es por tanto ms representativa en Y que en X. c) Compara la pureza del oxgeno ( %) en procesos en los que el nivel de hidrocarburo es inferior o igual a 1.25 con la de aquellos en el que es superior a 1.25. Para ello obtn la distribucin de frecuencias en ambos casos y determina por ejemplo las medias e intervalos modales. Qu se observa?. La variable Y /X 1,25 presenta los siguientes valores: 90.01, 89.05, 91.43, 87.59, 91.77 Su distribucin de frecuencias es: Y /X 1,25 (87-88.25] (88.25-89.5] (89.5-90.75] (90.75-92] frec. abs. 1 1 1 2 frec. rel. 0.2 0.2 0.2 0.4

2.4. Regresin lineal. Ajuste por mnimos cuadrados.

39

La de Y /X > 1,25 es: Y /X > 1,25 (93-94.75] (94.75-96.5] (96.5-98.25] (98.25-100] Medidas descriptivas: Media Y /X 1,25 Y /X > 1,25 89.97 95.576 Mediana 90.01 94.45 Moda (90.75-92] (93-94.75] CV 0.018 0.024 frec. abs. 3 0 1 1 frec. rel. 0.6 0 0.2 0.2

Se observa que la pureza del oxgeno ( %) producido en el proceso de destilacin parece aumentar con el porcentaje de hidrocarburos presentes en el condensador principal de la unidad de destilacin. d) Calcula la covarianza y el coeciente de correlacin. Interpreta los resultados obtenidos. x,y x,y = = 1149,5142 1,232 92,773 = 0,6550, 10 0,6550 = 0,917 0,2103 3,3962

Como el coeciente de correlacin est muy prximo a 1, podemos decir que existe una fuerte asociacin lineal positiva entre las variables. e) Estima la pureza del oxgeno ( %) producido cuando el nivel de hidrocarburo es del 1.25 %. En qu medida es able esta prediccin?.
Diagrama de dispersion Pureza del oxgeno (%)
102 99 96 93 90 87 0,87 1,07 1,27 1,47 1,67

Nivel de hidrocarburo (%)

Delia Montoro Cazorla.

Dpto.

de Estadstica e I.O. Universidad de Jan.

40

Captulo 2. Estadstica Descriptiva Bidimensional

= 14,819X + 74,516,

Y (1,25) = 93,039 R2 = 0,9172 = 0,8412 Las predicciones con la recta sern bastante ables al ser el coeciente de correlacin o el de determinacin muy elevados. Concretamente, la bondad del ajuste de la recta a la nube de puntos es del 84.12 %.

2.5.

Ejercicios

1. Se supone que el alargamiento de un cable de acero est relacionado linealmente con la intensidad de la fuerza aplicada. Cinco especmenes idnticos de cable dieron los resultados siguientes: Fuerza (X ) Alargamiento (Y ) 1.0 3 1.5 3.5 2 5.4 2.5 6.9 3 8.4

a ) Estudia el grado de asociacin lineal entre ambas variables. b ) Predice el alargamiento para una fuerza de 2.2. En qu medida es able tal prediccin?. 2. Las bodegas modernas utilizan vehculos guiados computarizados y automatizados para el manejo de materiales. En consecuencia, la disposicin fsica de la bodega debe disearse con cuidado a modo de evitar el congestionamiento de los vehculos y optimar el tiempo de respuesta. En The journal of Engineering for Industry (agosto 1993) se estudi el diseo ptimo de una bodega automatizada. La disposicin empleada supone que los vehculos no se bloquean entre s cuando viajan dentro de la bodega, es decir, no hay congestionamiento. La validez de este supuesto se veric simulando por ordenador las operaciones de la bodega. En cada simulacin se vari el nmero de vehculos y se registr el tiempo de congestionamiento (tiempo total que un vehculo bloquea a otro). Los datos se muestran en la tabla de abajo. Los investigadores estn interesados en conocer la relacin

2.5. Ejercicios

41

entre el tiempo de congestionamiento (Y) y el nmero de vehculos (X). X Y 1 0 2 0 3 0.02 4 0.01 5 0.01 6 0.01 7 0.03 8 0.03 9 0.02 10 0.04

a) Cuantica la dependencia lineal existente entre ambas variables. b) Obtn la recta de regresin que expresa el tiempo de congestin en funcin del nmero de vehculos. c) Predice linealmente el tiempo de congestin cuando el nmero de vehculos es de 12. Es able tal prediccin?. 3. Los siguientes datos se reeren al crecimiento de una colonia de bacterias en un medio de cultivo: X Y 3 115000 6 147000 9 239000 12 356000 15 579000 18 864000 ,

siendo X el nmero de das desde la inoculacin e Y el nmero de bacterias. Comprobar grca y numricamente que el tipo de asociacin entre ambas variables no es lineal. 4. Se ha realizado un estudio para investigar el efecto de un determinado proceso trmico en la dureza de una determinada pieza. Once piezas se seleccionaron para el estudio. Antes del tratamiento se realizaron pruebas de dureza para determinar la dureza de cada pieza. Despus, las piezas fueron sometidas a un proceso trmico de templado con el n de mejorar su dureza. Al nal del proceso, se realizaron nuevamente pruebas de dureza y se obtuvo una segunda lectura. Se recogieron los siguientes datos (Kg. de presin): Dureza previa Dureza post. 182 198 232 210 191 194 200 220 148 138 249 220 276 219 213 161 241 210 480 313 262 226

a ) Calcula la media, mediana, percentiles 25 y 75 de la dureza antes y despus del proceso. b ) Calcula la desviacin tpica en ambos casos. En qu caso hay mayor variabilidad?. c ) Se puede armar que el proceso de templado mejora la dureza de las piezas?. Delia Montoro Cazorla. Dpto. de Estadstica e I.O. Universidad de Jan.

42

Captulo 2. Estadstica Descriptiva Bidimensional

d ) Decide si un modelo lineal es adecuado para explicar la dureza posterior en funcin de la dureza previa. En caso armativo obtenlo y predice la dureza tras el proceso de templado de una pieza con un dureza previa de 215.

5. En un estudio sociolgico se postula que la actitud racista viene determinada fundamentalmente por el nivel de paro que en dicha sociedad existe. Para valorar esta armacin, el estudio proporciona los datos relativos a una muestra de 10 localidades, cuyos niveles de paro (en %) y racismo (medidos a partir de un ndice) son los siguientes:

Paro Racismo

7.5 22

13 29

5 15

23.2 37.1

33 50

21 35

18 32

30 40

15 30.3

27 38

a. Calcula medidas de posicin central (media, mediana, moda) que resuman ambas variables.

b. Qu variable presenta menor dispersin?.

c. Estudiar el grado de asociacin lineal entre las variables. Muestran los datos que por trmino medio cuanto mayor sea la tasa de paro en la localidad, mayor ser su ndice de racismo?. Razona la respuesta.

d. Qu valor de ndice de racismo se predice para una localidad con una tasa de paro del 20 % ?. Consideras able esta prediccin?.

6. Una compaa elctrica est interesada en desarrollar un modelo que relacione la demanda pico por hora (Y, en kw) con el uso de energa total al mes (X, en kwh). La tabla siguiente muestra los datos obtenidos de una muestra de 15 clientes:

2.5. Ejercicios

43

X(kwh) 679 292 1012 493 582 1156 997 2189 1097 2078 1818 1700 747 2030 5300

Y(kw) 0.79 0.44 0.56 0.79 2.70 3.64 4.73 9.50 5.34 6.85 5.84 5.21 3.25 4.43 2.70

a) Estudia el grado de asociacin lineal entre las variables.

Demanda por hora (Kwh)

Diagrama de dispersion
10 8 6 4 2 0 0 1 2 3 4 5 6 (X 1000)

Consumo energa al mes (Kwh)

b) Obtn una recta para predecir la demanda por hora en funcin del consumo mensual. Delia Montoro Cazorla. Dpto. de Estadstica e I.O. Universidad de Jan.

44

Captulo 2. Estadstica Descriptiva Bidimensional

Estima la demanda correspondiente a un consumo de 3000 kwh. En qu medida es able esta prediccin? 7. La hidrlisis de un cierto ster tiene lugar en medio cido segn un proceso cintico de primer orden. Partiendo de una concentracin inicial (por 103 (M )) desconocida del ster, se han medido las concentraciones del mismo a diferentes tiempos (en minutos) obtenindose los resultados siguientes: Tiempo Conc. 3 25.5 5 23.4 10 18.2 15 14.2 20 11 30 6.7 40 4.1 50 2.5 60 1.5 75 0.7 90 0.4

a ) Realiza una nube de puntos de las dos variables. La teora cintica de este tipo de reacciones nos indica que la evolucin de la concentracin del ster en funcin del tiempo se rige por Ct = C0 ekt , donde C0 es la concentracin inicial. Qu transformacin de los datos nos lleva a un modelo lineal?. Realiza esta transformacin y obtn la concentracin inicial C0 y la velocidad k de desaparicin del ster. b ) Suponemos ahora que nos comunican que la concentracin inicial del ster es C0 = 3,102 (M ). Cmo incorporar esta informacin a nuestro anlisis anterior?. Obtn el nuevo valor de k. 8. La densidad del ter dimetlico a 25 o C y diferentes presiones se indica en la tabla.

Presin (mmHg) Densidad (gr/cm3 )

91.74 0.2276

277.3 0.6898

452.8 1.1291

760 1.9029

a. Estudia el grado de asociacin lineal entre la presin y densidad del ter dimetlico a la temperatura dada. b. Determina la recta de regresion para predecir la densidad del ter dimetlico para una presin dada. Qu densidad se predice para una presin de 600 mmHg? c Te parece able tal prediccin?. Razona la respuesta. 9. Para analizar la degradacin de la seal emitida por una antena, se tomaron los siguientes datos: la frecuencia de la seal en el momento de ser emitida (X) y la frecuencia de la seal al ser recibida (Y). Los resultados medidos en Megahercios fueron:

2.5. Ejercicios

45

X Y

1.75 1.56

1.8 1.45

1.78 1.75

2.01 0.84

2.48 2.02

2.58 2.41

2.98 2.75

2.65 1.44

2.01 1.55

3.87 2.02

a. Calcular la media, mediana y moda de ambas variables. b. De las seales emitidas entre 2 y 3 Megahercios Cul es la proporcin de ocasiones en las que la frecuencia recibida fue menor que 2.5 Megahercios? c. Determinar el intervalo en el que se encuentra el 50 % central de la variable Y. d. Estudiar el grado de asociacin lineal entre las variables. e. Qu frecuencia se predice en la seal al ser recibida si al ser emitida es de 3.5 Megahercios?. Es able la prediccin?. 10. Una industria ha vertido a un ro prximo una cantidad cercana a los 3500 litros de sustancia contaminante. Por experiencias anteriores se sabe que la Administracin ha impuesto las siguientes sanciones (X en miles de litros) por vertidos de similares caractersticas y por las cantidades (Y en miles de euros) que a continuacin se indican: X (miles de litros) Y (miles de euros) 0.5 6 1 18 1.5 30 2 45 2.5 66 3 90 4 144

a. Obtener medidas de tendencia central (media, mediana, moda) para ambas variables. b. Qu variable es ms homognea con respecto a su media?. Razonar la respuesta. c. Estudiar el grado de asociacin lineal entre las variables. d. Estimar la cuanta de la sancin que la Administracin impondr a dicha industria. Te parece able tal estimacin?. Razonar la respuesta.

Delia Montoro Cazorla.

Dpto.

de Estadstica e I.O. Universidad de Jan.

Potrebbero piacerti anche