Sei sulla pagina 1di 24

ESTADSTICA

VARIABLESALEATORIAS.REGRESIONLINEAL

1.LASNOTASOBTENIDASPOR5ALUMNOSENMATEMATICASY
FISICASON

MAT64853.5
FIS6.54.5754
DETERMINARLASRECTASDEREGRESIONYCALCULARLANOTA
ESPERADA EN FISICA PARA UN ALUMNO QUE TIENE 7.5 EN
MATEM.
2.LASEDADESDELASPERSONASQUERESPONDIERONAUNA
ENCUESTASONLASSIGUIENTES
14,14,14,18,18,17,23,23,32,30,30,16,16,10,9
CALCULARLAMODA,MEDIANA,MEDIAYDESVIACIONTIPICA
3. LA ALTURA Y PESO DE SEIS RECIEN NACIDOS SON LOS
SIGUIENTES:
PESO(GRS.) 3.200 3.700 2.800 3.000 2.800
3.500
ALTURA(CM) 52 54 50 49 51
55
A)HALLARLASRECTASDEREGRESION

B)CALCULARCUANTOSEESPERAQUEMIDAUNRECIENNACIDO
DE4.000GRS.DEPESO
4. LAS CALIFICACIONES DE LENGUA Y FILOSOFIA DE 5
ALUMNOSELEGIDOSALAZARHANSIDO
lengua
filosofa

7.5
8.2

8
7.8

9.3
8.6

6.5
7.2

6.8
7.2

A) CALCULAR EL COEFICIENTE DE CORRELACION Y LAS


ECUACIONESDELASRECTASDEREGRESION
B)SILANOTADELENGUADEUNALUMNOES8.5,QUENOTA
CABEESPERARENFILOSOFIA?
5.EN UNA ENCUESTA SOBRE EL GASTO EN ALIMENTACION
MENSUAL DE LOS GALLEGOS, EN MILES DE PESETAS, SE
OBTUVIERON:
N.DEPERSONAS102540205
GASTOS 3a9 9,11 11,15 15,19
19,25
CALCULARLAMEDIAYLADESVIACIONTIPICA.

6. EL INDICE DE MORTALIDAD DE SIETE GRUPOS QUE


CONSUMIANDIARIAMENTEXCIGARRILLOSAPARECEENLATABLA
ADJUNTA:
Num.
3
Cigar.
Tasa
0.2
mortal.

15

20

30

40

45

0.3

0.3

0.5

0.7

0.8

1.4

1.5

ESTUDIARLACORRELACIONENTREXEY.
QUEMORTALIDADSEPUEDEPREDECIRPARAUNCONSUMIDORDE
60CIGARRILLOSDIARIOS?

7. LOS PESOS Y ALTURAS DE 10 ALUMNOS SON LOS


SIGUIENTES:
PESO70637260667074656765
ALTURA155150180135150168178160145139
HALLAR LA RECTA DE REGRESION Y LA ALTURA DE UN
ESTUDIANTEDEPESO64KGS.
8.ELNUMERODEMATRIMONIOS(ENMILES)ENESPAAHA
EVOLUCIONADOCOMOSEINDICAENLASIGUIENTETABLA
AO 1974 1975 1976 1977 1978 1979 1980 1981
1982
MATR.268 271 261 262 258 246 220 202
193
OBTENER LA RECTA DE REGRESION Y EL NUMERO DE
MATRIMONIOSESPERADOSPARA1995

9.LASIGUIENTETABLAMUESTRA,ENCADAAO,ELNUMERO
DETRASPLANTESDERIONEFECTUADOSENESPAA:
AO
1983
1984
TRASPL.688836

1985
968

1986
1182

1987
987

ESTABLECERCUALESLARECTADEREGRESIONYCALCULAREL
NUMERODETRASPLANTESESPERADOENELAO1997
10.SE LA MAEDIDO LA LONGITUD EN MM DE UNA BARRA DE
ACERO A DIFERENTES TEMPERATURAS OBTENIENDO LOS
SIGUIENTESRESULTADOS:
GRADOS
10
15
20
25
30
LONGITUD 1003 1005 101010121014
CALCULARLALONGITUDDEUNABARRAA18

11.LASESTATURASENUNACLASEDE30ALUMNOSFUERON
LASSIGUIENTES:
142,153,147,157,168,170
175,169,139,161,155,162
179,151,161,172,181,182
145,148,155,159,165,149
148,156,174,159,165,149
CALCULAR MEDIA, MODA, MEDIANA, RECORRIDO, DESVIACION
TIPICA,CUARTILESYC20,C60,C90

12) Personas Activas en 50 familias

13)sueldos
450

1152

250

300

175

80

25

2680

605

785

1595

2300

5000

1200

100

180

200

675

500

375

1500

205

985

185

125

315

14)Estaturas(discretaocontinua)
Alumno
Estatura
Alumno
Estatura
Alumno
Estatura
x
X
x
x
x
x
Alumno1
1,25
Alumno11
1,23
Alumno21
1,21
Alumno2
1,28
Alumno12
1,26
Alumno22
1,29
Alumno3
1,27
Alumno13
1,30
Alumno23
1,26
Alumno4
1,21
Alumno14
1,21
Alumno24
1,22
Alumno5
1,22
Alumno15
1,28
Alumno25
1,28
Alumno6
1,29
Alumno16
1,30
Alumno26
1,27
Alumno7
1,30
Alumno17
1,22
Alumno27
1,26
Alumno8
1,24
Alumno18
1,25
Alumno28
1,23
Alumno9
1,27
Alumno19
1,20
Alumno29
1,22
Alumno10
1,29
Alumno20
1,28
Alumno30
1,21

15)

Estatura

Habitante Estatura

Habitante

Estatura

Habitante

Estatura

Habitante1

1,15

Habitante

1,53

Habitante

1,21

425

560

1100

2
3

Habitante2

1,48

Habitante3

1,57

Habitante4

1,71

Habitante5

1,92

Habitante6

1,39

Habitante7

1,40

Habitante8

1,64

Habitante9

1,77

11
Habitante
12
Habitante
13
Habitante
14
Habitante
15
Habitante
16
Habitante
17
Habitante
18
Habitante
19

21
Habitante
22
Habitante
23
Habitante
24
Habitante
25
Habitante
26
Habitante
27
Habitante
28
Habitante
29

1,16
1,60
1,81
1,98
1,20
1,42
1,45
1,20

1,59
1,86
1,52
1,48
1,37
1,16
1,73
1,62

16)
Queremos hacer un estudio estadstico del nmero de Tcnicos Superiores en
Electricidad (TSE) que existen en las empresas elctricas de una determinada ciudad. Para ello se ha
encuestado a 50 empresas y se han obtenido los siguientes datos:

4
3

2
4

3
5

1
2

2
0

4
3

2
2

3
1

0
2

2
3

2
2

2
2

3
3

2
1

6
4

2
2

3
3

2
2

2
4

3
3

2
3

3
2

17)Se desea hacer un estudio estadstico del precio de un pequeo interruptor elctrico
de la marca Interelec, en las tiendas de material elctrico de una ciudad. Para ello se conocen los
precios en 40 tiendas de esa ciudad. Los datos obtenidos en euros son:
3,9
5,3
3,3
4,0

4,7
3,9
4,3
5,4

3,7
4,3
4,1
3,9

5,6
5,0
5,8
4,7

4,3
6,0
4,4
3,3

4,9
4,7
4,8
4,5

5,0
5,1
6,1
4,7

6,1
4,2
4,3
4,2

5,1
4,4
5,3
4,5

RELACIN DE EJERCICIOS DE ESTADSTICA DESCRIPTIVA.


Ejercicio 1: (Medidas de centralizacin y dispersin)

4,5
5,8
4,5
4,8

3
2

4
1

En un centro hospitalario de la provincia de Sevilla se ha tratado, con un nuevo medicamento


llamado SINDOLORCABEZON, durante 5 das a un grupo de pacientes, todos ellos padecen
de jaqueca crnica (se despiertan todos los das con dolor de cabeza). Se realiza un estudio
sobre el n de das que un paciente sufre mejora con el anterior medicamento obteniendo la
tabla:
Valores
xi

Frecuencias
ni

100

250

300

500

450

2000

Realizando el grfico adecuado y hallando los promedios (Media aritmtica, Media armnica,
Media geomtrica, Moda, y Mediana), indicar cul sera el que mejor representara los datos,
(Contesta razonadamente y con el mayor detalle posible)
Calcula tambin el porcentaje de pacientes que sienten mejora con el medicamento en todos
los das del tratamiento.
Por qu no calculamos el coeficiente de variacin para ver la representatividad de la media?
Habra que hallarlo?.
Calcula el D3.Qu significado tiene?
A aquellos pacientes que sienten mejora todos los das del tratamiento se les realiza un estudio
sobre el tiempo de reaccin del medicamento (en minutos), encontrndose recogido los datos
en la siguiente tabla:
Tiempo de reaccin N de pacientes

Se pide:

0-10

300

10-20

500

20-30

400

30-40

500

40-60

300

Escribir las frmulas de las diferentes medias e indicar cul de las tres te parece ms adecuada
para aplicar en este ejercicio (Razonadamente).
A todos los pacientes que tardan en reaccionar ms de 35 se le aplica el medicamento
complementario PAQUENODUELA para acelerar los efectos de SINDOLORCABEZON.
Hallar el nmero de pacientes a los que se le aplica este segundo medicamento.
Estudiar la representatividad del tiempo medio de reaccin. Es representativo? Por qu?
El Gobierno est pensando en introducir un medicamento con las caractersticas de
SINDOLORCABEZON. Existen en el mercado junto con este dos productos ms
PALACABEZA y SINJAQUECAHOY. El tiempo medio de reaccin de cada uno de ellos es
respectivamente 25 y 30 minutos, con una varianza de 200 y 300 minutos2. Explica
detalladamente que criterio de seleccin estadstico podra aplicar el Gobierno. Segn el
criterio anterior que medicamento sera el que pasara a engrosar la lista de medicamentos de
la Seguridad Social.

Ejercicio 2: (Medidas de centralizacin y dispersin)


La empresa automovilstica COCHESALMENDRON ha realizado un control de potencia
sobre los 1000 motores diesel que se han fabricado a lo largo del mes de noviembre del ao
1997 obteniendo la siguiente tabla:
Potencia en CV Frecuencias
0-50

50

50-60

200

60-65

400

65-70

300

Ms de 70

xi ni

50 4000(*)

Se pide:
Sin utilizar el dato en negrita que aparece en la tabla anterior, podras representar
grficamente el histograma de frecuencias? Por qu? (Razona detalladamente)
Calcula la potencia mediana de los motores. Sin el dato en negrita no podras calcular ni la
media (Por qu?) ni la moda (Por qu?), sin embargo calcular ambos promedios haciendo
uso del dato en negrita. e indicando que se ha supuesto para estos clculos.
En la especificacin tcnica del motor se indica que tiene una potencia mnima de 55 CV.
Hallar el porcentaje de motores con una potencia mayor que est (Nota: Realizarlo por dos
mtodos: Cuartiles y proporcionalidad).
Estudiar la representatividad de la media aritmtica. Sera representativa?

Los motores con menos de 55 CV se apartan de los dems y se estudia el nmero de piezas
defectuosa que han motivado la prdida global de potencia, obtenindose la siguiente tabla:
Valores Frecuencias
xi
ni
1

40

30

20

10

La media armnica, la media geomtrica y la media aritmtica guardan alguna relacin de


orden? Calcular ests medias y comprubalo.
Representa grficamente los distribucin de frecuencias de la tabla.
Calcula la moda y el recorrido intercuartlico.
Qu diferencia existe entre subpoblacin y encuesta?
Segn que criterio nos permite diferenciar las caractersticas de una poblacin?

Ejercicio 3: (Medidas de centralizacin y dispersin)


Se ha realizado una estadstica en el centro comercial CONTINENTOL sobre los gastos (en
miles de pesetas) que una familia tiene cuando realiza sus compras un da cualquiera de la
semana. Este estudio nos aporta la siguiente tabla:
Intervalos Frecuencias
0-5

1000

5-10

1100

10-20

1600

20-50

1000

50-100

300

Se pide:
Cul es el motivo por el que los datos se presentan en intervalos?
Te parece coherentes los datos de la tabla, o bien tendras que estudiar su procedencia antes
de continuar el estudio?

Halla los ingresos que en ese da tuvo el centro comercial y el gasto medio, modal y mediano
de cada familia.
Si a todas las familias que gastan ms de 40.000 pesetas, se les obsequia con una bolsa de
deporte o una cafetera, ambas valoradas en 2.500 pesetas. Hallar el nmero de regalos que
realiza el centro comercial, as como el porcentaje de clientes que se benefician de ellos.
(Nota: utilizar percentiles )
Hallar el primer cuartil. Qu significado tiene?
Estudiar la representatividad del gasto medio. Es representativa? Por qu?
De las diez personas encargadas de realizar la encuesta se sabe, de aos anteriores, que tres de
ellos se equivocan al elaborar la encuesta un 10% de las veces; cuatro rellenan ellos mismos el
cuestionario y se equivocan el 75% de las veces y el resto son muy detallistas y cumplen
perfectamente su trabajo. Se pide: Cul es la variable? Cul es la frecuencia? Por qu los
datos no se dividen en intervalos? Hallar la media de la variable.

Ejercicios 4: (Medidas de centralizacin y dispersin)


Se realiza una estadstica en dos centros de enseanza, uno pblico y otro privado, referente a
la nota global del bachillerato de cada uno de los alumnos que van a acudir a los exmenes de
selectividad. Las distribuciones de frecuencias son las siguientes:
Centro privado
Nota global de
cada alumno.

Frecuencias

5,5

10

6.5

15

7.5

20

8.5

30

9.5

15

Centro pblico
Nota global de
cada alumno.

Frecuencias

[5 , 6

250

(6 , 7

150

(7 , 9

100

(9, 10

20

Se pide:
a) A la vista de la tabla, te sugiere algn comentario de especial importancia. Cul es el
motivo de que los datos se presente en dos tablas de diferente tipo ?
b) Estudiar las diferentes medidas de tendencia central (promedios) en las dos distribuciones.
En cada distribucin cul te parece ms representativo? por qu?
c) Hallar el porcentaje de alumnos que en cada centro tiene una nota global superior al 7.
d) Hallar los cuartiles primero y tercero de las dos distribuciones.
e) Estudiar la representatividad de las medias obtenidas en las distribuciones por separado.
En cul de las dos es ms representativa?
f) Dos alumnos pertenecientes el primero al centro privado y el segundo, al centro pblico,
solicitan una beca para continuar sus estudios en la universidad mejicana de Acapulco. el
primero tiene una nota global de un 8.5 y el otro de un 7. Si slo se concede una beca quin
sera el candidato a obtenerla aplicando el criterio estadstico de la variable tipificada?

Ejercicios 5: (Medidas de centralizacin y dispersin)


A la finalizacin del curso "Informtica e Internet" se realiz un examen tipo test a los 300
alumnos obtenindose la siguiente tabla relativa al nmero de preguntas acertadas:
N preguntas acertadas N de alumnos

Se pide:

0-10

10

10-15

20

15-20

60

20-23

100

23-25

70

25-30

30

30-40

10

Representa grficamente la distribucin de frecuencias anterior


Hallar la media
Cul ser el nmero de preguntas tal que la mitad de los alumnos obtengan un nmero de
preguntas acertadas mayor que est?
Cul es el nmero de preguntas que ms se repite? Contesta con todo detalle.
Para la realizacin de la segunda parte del curso se convocan sesenta plazas. Hallar el nmero
de preguntas mnima que ha debido acertar un alumno para poder realizar la continuacin del
curso.
Una vez finalizado este segundo curso, se realiza un examen a los alumnos obtenindose las
siguientes notas:
Notas N Alumnos
4

12

5.5

15

14

6.5

Se pide:
Por qu no se agrupan los datos en intervalos, como anteriormente?
Halla la mediana, la moda, la media armnica y el recorrido intercuartlico.
Hallar y estudiar la media y su representatividad.
Qu resulta ms meritorio, obtener 28 preguntas acertadas en el primer examen u obtener un
6.5 en el segundo?
Si se concede un 15% de diplomas entre los alumnos de la segunda parte del curso. A partir
de qu nota se concedern?

Ejercicio 6: (Regresin y correlacin)


Dada la difcil situacin por la que atraviesa actualmente la empresa QUEMALAPATA en la
que hemos empezado a trabajar, se propone la reduccin de determinados gastos. Para ello se

estudia la relacin que existe entre dos variables como son: los gastos en publicidad (variable
X) y los beneficios (variable Y). De ambas variables disponemos de los siguientes datos:
Ao

1993

1994

1995

1996

1997

Gastos en Publicidad
(105 ptas)

70

75

80

90

104

Beneficios
(106 ptas)

33

45

50

65

67

Se pide:
Se puede considerar que ambas variables guardan algn tipo de relacin? Cul sera la
variable dependiente y cul la independiente?
Realizando un grfico adecuado. Se puede suponer que la relacin que las liga es de tipo
lineal?
Construye las dos rectas de regresin mnimo cuadrtica asociada con las variables.
Si la empresa para el prximo ao realizar un esfuerzo para poder invertir 11.500.000 ptas en
publicidad. Cules resultaran ser sus beneficios? Con qu fiabilidad realizara usted la
prediccin?
Cules resultaran ser sus beneficios si la prediccin se efecta considerando tan solo como
variable explicativa el tiempo? Cul sera la fiabilidad de esta otra prediccin? Comente los
resultados.

Ejercicio 7: (Regresin y correlacin)


Un estudiante de Estadstica de la provincia de Sevilla, para poder pagarse sus estudios debe
trabajar como camarero en un bar de copas de su localidad CASTILLEJADELCUESTON, al
cual suelen acudir todos los jvenes de la zona. Este ao con los conocimientos aprendidos
decide por fin estudiar la relacin existente entre las galletas saladas y el consumo de bebidas,
ya que, es costumbre, dar al cliente este aperitivo cuando se pide una consumicin.
Las galletas no pueden tener una concentracin de sal superior a 35 gramos por cada 10.000
galletas, y por ello decide ir variando a partir de 10 gramos la concentracin de 5 en 5 gramos
cada semana e ir anotando el incremento en caja semanalmente. Obteniendo la siguiente tabla:
Gramos de sal por cada 1000
galletas

1.5

2.5

Ingresos en caja ( en pesetas)

140300

150000

165000

175000

200000

Se pide:

Establecer un modelo lineal que relaciona las dos variables, estudiando la fiabilidad de dicho
modelo
Como consecuencia de los resultados anteriores el propietario del bar decide aadir a las
galletas 4025 gramos de sal, que coincide con toda la sal que tiene , en los almacenes .
Realiza una prediccin de los ingresos en caja y comente el resultado.
Si el propietario desea unos ingresos de 160.000 pesetas que cantidad de sal aportara a las
galletas. Si aporta 2,75, cul sera el ingreso en caja?. Explicar cual de las dos perdiciones te
merece mayor confianza.

Ejercicio 8: (Regresinsimple-mltiple y correlacin)


Un holding formado por cinco empresas pblicas, decide en vista de una prxima
privatizacin realizar un anlisis conjunto de sus actividades.
La valoracin del conjunto de todas las empresas es de 20 (en miles de millones de pesetas),
donde las empresas A y B representan cada una de ellas el 30% de la valoracin total. La
empresa C supone un 10% de dicha valoracin repartindose a partes iguales el resto las otras
dos empresas.
Se pide:
Hallar el valor medio de las empresas del holding y estudiar si este es representativo.
Si el beneficio neto que obtuvieron las empresas en el periodo anterior fue el siguiente:

Empresa

Beneficios
(en millones de
pesetas)

224

233

107

155

130

Se pide:
Es equitativo el reparto de los beneficios entre las empresas?.
Construye un modelo lineal que explique los beneficios en funcin del valor de la empresa.
Es aceptable el modelo construido?

Aparece una nueva variable: nmero de empleados (en cientos de trabajadores). Sabemos que
la recta de regresin del n del empleados respecto a la valoracin es:
n empleados=0.53+1.07 Valoracin,
con un coeficiente de determinacin igual a 097. Tambin sabemos que el coeficiente de
correlacin de la recta de regresin del beneficio respecto al nmero de empleado es igual a
095.
Se pide:
Hallar la matriz de varianza-covarianza de las tres variables y el porcentaje de varianza
explicada por el plano de regresin que explica el comportamiento del beneficio en funcin
del nmero de empleados y la valoracin de la empresa.

Ejercicio 9: (Regresin simple-mltiple y correlacin)


Un hipermercado ha decidido ampliar el negocio. Decide estudiar de forma exhaustiva el
nmero de cjas registradoras que va a instalar, para evitar grandes colas. Para ello, se
obtuvieron los siguientes datos procedentes de otros establecimientos similares acerca del
nmero de cajas registradoras (variable X2) y del tiempo medio de espera (variable X1).
N de cajas registradoras

10

12

14

12

18

20

Tiempo medio de espera

59

51

42

32

26

22

Bajo el supuesto de que el tiempo de espera medio depende linealmente del nmero de cajas
registradoras se pretende saber:
Cmo vara el tiempo medio de espera por cada unidad de caja adicioanl?
Si se instalaran 17 cajas registradoras, Cul sera el tiempo medio de espera? Es fiable dicho
dato?
Posteriormente, se penso que poda ser conveniente para explicar el tiempo de espera tener en
cuenta adems el nmero de clientes que acuden diariamente a estos establecimientos
(variable X3), por lo que se estudio el tema, obtenindose un coeficiente de correlacin lineal
entre ambas variables de 09343, siendo el nmero medio de clientes para los establecimientos
anteriores de 850 personas, con un coeficiente de variacin del 1074%. Adems, la
covarianza entre el nmero de cajas y el nmero de clientes que acuden diariamente a estos
establecimientos resulto ser de -300. Calcule los parmetros del modelo lineal que explica el
tiempo medio de espera en funcin del nmero de cajas y del nmero de clientes que acuden
diariamente.

Ejercicio 10: (Regresin simple y correlacin)

La empresa GURSO, S.A. ha recibido sugerencias para que invierta sus excesos de tesorera
en acciones de un poderoso grupo financiero nacional, dado que su cotizacin diaria en la
Bolsa de Valores nacionales proporciona una gran liquidez a estas inversiones, y la evolucin
reciente de sus cotizaciones permiten pronosticar interesantes rentabilidades. El Departamento
de Anlisis Financiero de GURSO, S.A. recibe el encargo de realizar un estudio sobre la
rentabilidad a corto plazo de estas acciones.
El Sr. Gonzlez, Director del Departamento de Anlisis Financiero, ha estudiado la
rentabilidad de estas acciones utilizando la informacin sobre las variaciones de las
cotizaciones burstiles, en un ejercicio simulado de cinco operaciones de compraventa de un
mismo nmero de ttulos de este grupo en cortos periodos recientes, siempre con referencia a
la Bolsa de Valores de Madrid.
Ha observado que los precios en el primer y ltimo periodo eran iguales y un 10% superiores a
los precios de los periodos segundo y cuarto, que a su vez eran un 10% inferiores al precio del
tercer periodo que es de 1000 pesetas. Se podra suponer que el precio medio resultante de
estas operaciones simuladas suficientemente representativo de este conjunto de cinco precios?
Vistas las rentabilidades obtenidas el Sr. Gonzlez se ha propuesto explicar el beneficio de
cada operacin simulada mediante una relacin lineal del precio de adquisicin de las
acciones, ya que ha encontrado que para un precio de adquisicin de 950 pesetas por accin,
se obtiene un beneficio de 400 pesetas en cada ttulo negociado, y que cuando el precio de las
acciones se incrementan en 2 pesetas, el beneficio de la operacin de compraventa se reduce
en 10 pesetas. Los clculos internos del Departamento de Anlisis financiero de GURSO, S.A.
muestran que la varianza de los beneficios simulados es 26 veces la varianza de los precios de
adquisicin. Cul es la expresin numrica de la funcin que estn manejando en el
Departamento de Anlisis Financiero de GURSO, S.A.? Cul es el beneficio medio de las
cinco operaciones de compraventa simuladas en dicho Departamento? Puede indicarnos,
razonadamente, si dicha funcin lineal proporciona un grado de explicacin aceptable para el
beneficio por el precio de adquisicin?
La Direccin de GURSO, S.A. slo est dispuesta a realizar estas inversiones si el beneficio
por accin es de, al menos, 400 pesetas. Qu precio mximo es el que determinar el Sr.
Gonzlez para poder recomendar la inversin?

DISTRIBUCIONES BIDIMENSIONALES
RESULTAN DE ESTUDIAR FENMENOS EN LOS QUE PARA CADA OBSERVACIN SE
OBTIENE UN PAR DE MEDIDAS Y, EN CONSECUENCIA, DOS VARIABLES.

Ejemplos.
Tallaypesodelossoldadosdeunregimiento.
Calificaciones en Fsica y Matemticas de los alumnos
deunaclase.

Gastosdepublicidadyventasdeunafbrica.
Etc.

Estas variables resultantes de la observacin de un fenmeno respecto de dos modalidades se


llaman variables estadsticas bidimensionales.
Losvaloresdeunavariableestadsticabidimensionalsonpares
denmerosrealesdelaforma(xi,yi).
Representadosenunsistemadeejescartesianosseobtieneun
conjunto de puntos llamado diagrama de dispersin o nube de
puntos.
Ejemplo:Nubedepuntosdeladistribucindadaporlatabla
siguiente:
NotasdeMatemticasyFsicade10alumnos
Matemtic 5
6
2
9
4
5
1
3
as
Fsica
4
5
3
8
4
5
2
2

Notas
de
Fsica

Notasde
Matemticas

Parmetrosestadsticos.

MediadelavariableX: x

n x
i

MediadelavariableY: y

n x y
i

N
ni yi2

VarianzadelavariableY: s y2
Covarianza: s xy

n y

N
ni xi2

VarianzadelavariableX: s x2

x. y

Correlacin.
Estudia la relacin o dependencia que existe entre dos
variablesqueintervienenenunadistribucinbidimensional.
Coeficientedecorrelacinlineal.
Es un nmero que mide el grado de dependencia entre las
variablesXeY.
Semidemediantelasiguientefrmula: r

s xy
s x .s y

Suvalorestcomprendidoentre1y1.
Si r = 1 r = 1 todos los valores de la variable
bidimensionalseencuentransituadossobreunarecta.
Si1<r<0sedicequelasvariablesXeYestntambin
endependenciaaleatoria.Lacorrelacinesnegativa.
Si0<r<1lacorrelacinespositiva.LasvariablesXeY
estntambinendependenciaaleatoria.
Lacorrelacinestantomsfuerteamedidaquerseaproximaa
11yestantomsdbilamedidaqueseaproximaa0.
Rectaderegresin.
Tenemosunadistribucinbidimensionalyrepresentamoslanube
depuntoscorrespondiente.Larectaquemejorseajustaaesa
nube de puntos recibe el nombre de recta de regresin. Su
ecuacineslasiguiente:
Rectaderegresindeysobrex: y y

s xy
s x2

Rectaderegresindexsobrey: x x

( x x)

s xy
s y2

( y y)

A partir de esta recta podemos calcular los valores de x


conocidoslosde y.Lafiabilidadquepodemosconcederalos
clculos obtenidos viene dada por el coeficiente de

correlacin: si r es muy pequeo no tiene sentido realizar


ningntipodeestimaciones.
Siresprximoa11,lasestimacionesrealizadasestarn
cercadelosvaloresreales.
Si r =1o r =1,lasestimacionesrealizadascoincidirn
conlosvaloresreales.

Ejerciciosresueltos.
1. Una compaa de seguros considera que el nmero de
vehculos(Y)quecirculanporunadeterminadaautopistaams
de120kms/h,puedeponerseenfuncindelnmerodeaccidentes
(X)queocurrenenella.
Durante5dasobtuvolossiguientesresultados:
X
572
19
Y
15 18 10
820
a) Calculaelcoeficientedecorrelacinlineal.
b) Si ayer se produjeron 6 accidentes, cuntos vehculos
podemossuponerquecirculabanporlaautopistaamsde120
kms/h?
c) Esbuenalaprediccin?
Solucin:
Disponemoslosclculosdelasiguienteforma:
(Accide Vehcu
ntes)
los
xi2
yi2
xiyi
xi
yi
5
15
25
225
75
7
18
49
324
126
2
10
4
100
20
1
8
1
64
8
9
20
81
400
180
24
71
160
1113
409

24

4,8 ;
N
5
xi2 x 2 160 4,8 2 8,96
s x2
N
5
x

s
=13,64

2
y

2
i

1113
14,2 2 20,96 ; s xy
5

x y
i

y
N

x. y

71
14,2 ;
5

409
4,8.14,2
5

a) r

s xy
s x .s y

13,64
8,96 . 20,96

0,996

b)Rectaderegresindeysobrex: y y

s xy
s x2

( x x)

13,64
( x 4,8) ; y 14,2 1,53( x 4,8)
8,96
Para x = 6, y 14,2 1,53(6 4,8) , es decir, y = 16,04.
y 14,2

Podemos suponer que ayer circulaban 16 vehculos por la


autopistaamsde120kms/h.
c)Laprediccinhechaesbuenayaqueelcoeficientede
correlacinestmuyprximoa1.
2.Lascalificacionesde40alumnosenpsicologaevolutivay
enestadsticahansidolassiguientes:
X
Y
Nmero
calif.en
calif. en
de
psicol.
estad.
alumnos.
3
2
4
4
5
6
5
5
12
6
6
4
6
7
5
7
6
4
7
7
2
8
9
1
10
10
2
Obtenerlaecuacindelarectaderegresindecalificaciones
deestadsticarespectodelascalificacionesdepsicologa.
Culserlanotaesperadaenestadsticaparaunalumnoque
obtuvoun4,5enpsicologa?
Solucin:
Sepidelarectaderegresindeysobrex:
yy

s xy

( x x)
s x2
Disponemos los datos de la siguiente forma:
xi
yi
ni
nixi
3
2
4
12
24
4
5
6
60
5
5
12
24
6
6
4
30
6
7
5
28
7
6
4
14
7
7
2
8
8
9
1
20
10
10
2

niyi
8
30
60
24
35
24
14
9
20

nixi2
36
96
300
144
180
196
98
64
200

niyi2
16
150
300
144
245
144
98
81
200

nixiyi
24
120
300
144
210
168
98
72
200

40
x

n x
i

s xy

s x2

n x y
i

n x
i

2
i

224

1314

220
5,5 ; y
40

220

x. y

1378

n y
i

1336

224
5,6
40

1336
(5,3).(5,6) 33,4 30,8 2,6
40

1314
(5,6) 2 32,85 30,25 2,6
40

Sustituyendoenlaecuacindelarectaderegresin,resulta:
y 5,6

2,6
( x 5,5) ,esdecir, y x 0,1
2,6

Siunalumnoquetieneunanotade4,5enpsicologa,lanota
esperadaenestadsticaser:
y(4,5)=4,5+0,1=4,6
Sesustituyeenlarectaderegresin.
La fiabilidad viene dada por el coeficiente de correlacin:
r

s xy
s x .s y

s xy 2,6 ; s x

2
y

n y

2
i

yresulta r

s x2

2,6 1,61

1378
(5,6) 2 3,09 ; s y 3,09 1,75
40

2,6
0,92
(1,61).(1,75)

Lacorrelacinespositiva,esdecir,amedidaqueaumentala
notadeestadsticaaumentatambinlanotaenpsicologa.Su
valor est prximo a 1 lo que indica que se trata de una
correlacinfuerte,lasestimacionesrealizadasestncercade
losvaloresreales.
Tablasdedobleentrada.
Enlasdistribucionesbidimensionales,cuandohaypocospares
de valores, se procede como hemos hecho, es decir,
enumerndolos. Si algn par est repetido se pone dos veces,
pero cuando el nmero de datos es grande, se recurre a las
tablasdedobleentrada.
En cada casilla se pone la frecuencia correspondiente al par de valores que definen esa casilla.

Ejemplo:
x
y
0
1
2

0
2
3
0

1
1
4
5

2
0
1
3

Loqueindicaelnmerodevecesqueestcadapar.Elpar(0,
1)est3veces.
Elpar(1,2)est5veces.Etc.

Ejerciciospropuestos.
1. Las notas obtenidas por 10 alumnos en Matemticas y en
Msicason:
Alumnos Mat. Ms.
1
6
6,5
2
4
4,5
3
8
7
4
5
5
5
3,5
4
6
7
8
7
5
7
8
10
10
9
5
6
10
4
5
a) Calcula la covarianza, las varianzas y el coeficiente de
correlacin.
b) Existecorrelacinentrelasdosvariables?
c) Calculalarectaderegresin.Culser lanotaesperada
en Msica para un alumno que hubiese obtenido un 8,3 en
Matemticas?
(Soluc.3,075; 3,76; 2,96; 0,92; y=1,6+0,817x;
8,38)

2. Cinco nias de 2, 3, 5, 7 y 8 aos de edad pesan


respectivamente14,20,30,42y44Kg.Hallalaecuacindela
recta de regresin de la edad sobre el peso. Cul sera el
pesoaproximadodeunaniade6aos?.
(Sol.x=0,192y0,76;35,2Kg.)

3.Latablaadjuntadaelndicedemortalidaddeunamuestra
depoblacinenfuncindelconsumodiariodecigarrillos:
Nmerodecigarrillos 35
x
615
20
ndicedemortalidad 0,20,3
y
0,40,5
0,7
a) Determinaelcoeficientedecorrelacineinterpretael
resultado.
b) Hallalarectaderegresindeysobrex
c) Culserelndicedemortalidadparaunconsumidorde40
cigarrillosdiarios?

Potrebbero piacerti anche