Sei sulla pagina 1di 80
Seccién 4.3 Regresién y prediccién = 165 Pantalla 4.3 Se puede usar MINITAB para determinar la ecuacién de regresiOn para los datos de la marca mundial. La pantalla 4.3, muestra la informacion de las 6rdenes y las respuestas. MTB > READ C1 c2 DATA > 1 4,023 DATA > 10 3.990 DATA > 10 3.967 DATA > 13 3.953 DATA > 14 3.908 DATA > 18 3.907 : DATA > 20 3.902 ie DATA > 213.893 5 a DATA > 22 3.855 ‘ DATA > 23 3.852 3 DATA > 31 3.833 ‘ DATA > 31 3.823 ae : DATA > 37 3.788 : Sy DATA > 413.772 ae DATA > END es 14, ROWS READ MTB > NAME C1 ‘CODYEAR’ MTB > NAME C2 'CODETIME’ MPB > REGRESSION C2 1 C1 THE REGRESSION EQUATION IS CODETIME = 4.03 ~ 0.00655. CODEYEAR la relacién entre rym Tanto el coeficiente de correlacién r como la pendiente de regresién m utilizan las cantidades SSxy y SSx; en consecuencia, es posible obtener uno en términos del otro. Usando un poco de Algebra elemental, se puede demostrat la validez de la relaci6n siguiente, ‘Relacién entrerym Sr y (4.11) r= donde s, es la desviacién estandar muestral de x y s, es la desviacién esténdar muestral de y. Como s, y 5, son mayores que cero, el coeficiente de correlacién r concuetda en signo con la pendiente de ta recta de regresi6n; por lo tanto, la formula (4.11) ofrece otra explicacién de por qué la correlacién ¢s positiva si los puntos del diagrama de dispersién se acumulan de abajo a Ja izquierda a arriba a la derecha, y negativa si los puntos se acumulan de arriba a la izquierda y de abajo a la derecha, Si despejamos m de la férmula (4.11), tenemos: =5t may 166 = Andlsis descriptivos de datos bvariados 5 : Sir=1,entonces m =e como se ilustra en el diagrama. y Recta de regresion, ‘APLICAGION 4.8... | Se puede usar un programa computacional para realizar un andlisis de 7 = regresién que proporcione valores para b, m y r. Considere el ritmo cardiaco maximo y las edades que se registraron para diez individuos en un programa intensivo de ejercicios. Los datos son: Edad 1020 2025 30_ 404550 Ritmo [210 200 195 195 190 180 185 180 170 165 ardiaco La respuesta aqui ilustrada contiene el anélisis de regresién apropiado; advierta que se usa una notacién diferente: m representa la pendiente de la recta de regresiGn, n el nimero de pares de datos, B es la interseccién con el eje-y, R representa el coeficiente de correlaci6n y S.D. significa la desviacién estindar poblacional, El concepto de grados de libertad se estudiaré poste- riormente en el texto. Los paquetes de programacién proporcionan con frecuencia més respuestas de las que se necesitan en una cierta etapa y usan notaciones distintas fe CORRELATION AND LINEAR REGRESION VARIABLEX: AGE VARIABLE Y: HEART RATE MEAN OF X=30° > MEAN OF ¥: 187 = SD.OFX=11.61895 .< -__S.D. OF Y: 13.07670 £ NUMBER OF PAIRS (N) = 10 CORRELATION COEFFICIENT ®- 091 DEGREES OF FREEDOM (DF) = ‘SLOPE (M) OF REGRESSION 11 INE = 1.09259. Y INTERCEPT (B) FOR THE LINE = 219.778 Las respuestas computacionales de los programas comerciales con frecuencia no contienen alguna informacién deseada; pero muchas veces, 1a informaci6n faltante puede calcularse de la proporcionada en Ja respuesta. Seccin 43 Regresién y prediccién « 167 Por ejemplo, de la respuesta anterior podemos determinar la ecuacién de regresi6n y la suma de cuadrados de los errores, SSE, {Qué ritmo cardiaco méximo deberfa predecirse para una edad de 28 afios? | | | | Soluci6n: La ccuacién de tegtesiGu es’) = 219,778 ~ 1.09259x. Para la edad de 28 afios, deberfamos esperar una pulsacién maxima de: 3 = 219.778 - 1.09259(28) = 189.185 Para encontrar SSE, usaremos la f6rmula (4.10); primero necesitamos encontrar $S,, SS, y S8,,. Como la varianza poblacional est definida por o° = SSIN y.la varianza muestral esta definida por s’ = SS/(n—1), para determinar el valor de SS dado o, multiplicamos 0? por N. Esto es, s? = NAn~ 1)o” y SS = No*. En consecuencia, SS, = Noi = 10(11.61895)' = 1350 SS, = No; = 10(13.07670) = 1710 Como la pendiente de la recta de regresiGn esta definida por: P se SS, podemos despejar SS,, de esta ecuaciGn para obtener: SSy = mSS, (-1.09259)(1350) -1474.9965 Por Jo tanto, 1a suma de cuadrados de los errores es: SSE = SS, - mSS, = 1710 ~ (-1.09259)(-1474,9965) = 98.4336 = [GRUPO DE FERTICIOS 4 Habilidades basicas 1. Para cada una de las ecuaciones siguientes, encuentre la pendiente y la interseccién de la recta con el ele y, y dibuje la grafica. a)y=2x-3 byaxe2 ) e+ 3y=6 Qy=2 2. Para cada una de las ecuaciones siguientes, encuentre la pendiente y la intercepcisn de la recta con el eje y yy dibuje la grafica: ays-2r43 byysar—4 2 y= (23)x 3, Encuentre la ecuacién de regresién y SSE para los datos del ejescicio 1 del grupo de ejercicios 4.2. Los datos se repiten aquf por conveniencia. x[152489 y[372674 4, Para el ejercicio 2 del grupo de ejercicios 4.2, encuentre la ecuacién de regresién y SSE. Los datos se repiten aqut: Bia 8 1 Seo. yi8 714745 5. Parael eyereicio 7 del grupo de ejercicios 4.2, encuen- tre Ia ecuacién de regresién y SSE. Los datos se repiten aqui: 014-526 yl24t2 704 168» Andiss descriptivos de datos bvarados 6. Los datos del ejercicio 8 del grupo de ejercicios 4.2 se dan en la tabla. Encuentre la ecuaci6n de regresién y SSE. O74 sd y]2 6-160 -4 4 7. Los datos del ejercicio 10 del grupo de ejercicios 4.2 se reproducen aquf. Encuentre la ecuacién de regresiGn y SSE, x|77 81 94 50 72 63 88 95 y| 82 47 85 66 65 72 89 95 8. Los valores de los estadisticos siguientes se obtuvie- ron al analizar nueve pares de datos bivariados: = 0.049 ‘Encuentre la ecuacién de regresion y= b + mx y SSE. 9. Los valores siguientes se obtuvieron de nueve pares de datos bivariados: ¥= 7.2167, S<= 2.60702, J=112722, r= 0.622 5,5 5.24589, n=9 Encuentre la ecuacién de regresién } = b + mx y SSE. Mas aplicaciones 10.Considere los datos bivariados: x3 647 TL ~Tyy' =y—Y (recuerde que x" y y’ son las. desviaciones de los valores). a) Determine la ecuacién de regresi6n $* = b) Defina 9° six’ 11.Considere los datos bivariados: 5.41 8 6 —F (recuerde que x’ y y’ son las desviaciones de los valores). 4) Determine la ecuaciGn de regresion 5° = b + mx’. b) Calcule $” six’ = LL 12.B] clima parece tener efecto en la ofensiva en el beisbol. Los datos adjuntos indican la relacién entre temperatura y ofensiva desde 1987 hasta 1989.” (Esta aplicacién se describi6 en el motivador 4.) ‘Temperatura Porcentaje Carreras Jonrones debateo por juego por juego 0-59" 248 8.0 40 60" 69° 0.253 85 1.65 10°19" 0.259 86 1.69 80°89" 0.263 91 1.85 90° y més 0.263 9 1.83 Use las marcas de clase para las temperaturas 60°-89° para determinar la ecuaci6n de regresién que puede usarse para predecir las carreras por juego para una temperatura dada. 13, Refiérase al ejercicio 12. Use las marcas de clase para Jas temperaturas 60°-89° para determinar la ecuacién de regresién que puede usarse para predecir cuadran- gulares por juego para una temperatura dada. 14,La tabla adjunta enlista las marcas olimpicas de nata- ci6n, en segundos, en los 400 metros de estilo libre para mujeres desde 1924. Afio Tiempo Afio Tiempo 1924 362.20 1964 283.3 1928 3428 1968 271.8 1932 3285 1972 259.04 1936 3264 1976 249.89 1948 3178 1980 248.76 1952 3121 1984 247.10 1956 294.6 1988 243.85 1960 290.6 Encuentre la ecuacién de regresi6n y dsela para pre~ decir la marca mundial en 1962. (Sugerencia: codifi- que los afios usando x= afio ~ 1923.) 15.Las marcas olimpicas de nataci6n, en segundos, en los, 400 metros de estilo libre para hombres desde 1924 son: Aiio. Tiempo Aito Tiempo 1924 304.02 1964 252.2 1928 3016 1968 2490 1932 2884 1972 240.27 1936 2845 1976 231.93 1948 281.0 1980 231.31 1952 270.7 1984 231.23 1956 2673 1988 226.95 1960 __ 258.3 Encuentre la ecuacién de regresi6n y isela para pre- decir el tiempo de los hombres para 1992. (Sugeren- cia: codifique los afios usando x= aio - 1923.) 16,Se realiz6 un estudio para probar la efectividad de un ‘nuevo férmaco para reducir el rtmo cardiaco en pa- cientes adultos que padecen del coraz6n, donde parti- ciparon mil enfermos; en la tabla adjunta se muestra la reduccién promedio del ritmo cardiaco, medido en pulsaciones por minuto, para cada una de diez dosis, ‘en miligramos, del férmaco. 50 75 100 125 150 175 200 225 250 275 85 1 Ml 13 12 18 18 16 19 Dosis (2) Reduccisn| promedio del ritmo cardiaco a) Determine la ecuacién de regresién para predecir Ja reducci6n promedio del ritmo cardiaco dada una dosis fija del farmaco. >) Use la ecuacién para predecir a reduccién pro- ‘medio del ritmo cardiaco de un paciente que toma 300 mg del medicamento. Un paso més alla 17-Use las ecuaciones de regresién encontradas en los ejercicios 14 y 15, para calcular el afio en el cual el tiempo predicho para las mujeres serd igual al anun- ciado para los hombres en 1a competencia de 400 ‘metros estilo libre. Analice sus resultados. 18.Paralos datos enel ejercicio 10, encuentre los puntajes, 2, & pata x, y los puntajes z, z, para y. Determine entonces la ecuaci6n de regresién 2, = b + mz, y encuentre 19, Refigrase a la pantalla adjunta, 4) Encuentre la ecuacién de la recta de regresi6n, Secclén 4.2. Regresiény prediccién 169 b) Encuentre $SE, 20, Demuestre la formula (4.11). 21.Compruebe que SSE = $$, ~m' SS,. 22.Una medida de la forma en que los puntos de un iagrama de dispersi6n se distribuyen alrededor de la recta de regresiGnesel error estindar de estimacién 5» 10 cual esté definido por s, = \SSE/(n— 9). En- cuentre , para los datos del ejercicio 10. 23,Demuestre que Z()-$) =0, donde $= b+ ma. 24.Compruebe que (F, J) es un punto de la recta de regresin. 25. Verifique que la ecuaci6n de regresién puede escribir- se como S24 m(x—N, 26. Para los datos de la marca de Ja milla de la aplicacién 4.4, encuentre la ecuacién de regresién para predecit afios, dados los tiempos para la marca; use esa ecua- cin para predecir el afo en el cual la marca mundial para el recorrido de la milla sera de 3:40. {En qué afio (1999 © el afio obtenido aqui) dirfa usted que dicha ‘marca sera de 3:40? 170 Andliss descriptvos de datos bivariados RESUMEN DEL CAPITULO eae, =] En este capitulo se introdujeron los conceptos de ecuaciones lineales, regresién lineal y correlacién lineal; para determinar si existe una relacién lineal entre dos variables, a menudo se usa un diagrama de dispersi6n; vimos que la fuerza de la relacién lineal puede medirse por el coeficiente de correlacién ry la covarianza muestral syy; los valores del coeficiente de correlacién r pueden caer en cualquier lugar del intervalo entre -1 y 1, inclusive; si los puntos del diagrama de dispersién caen todos en una recta, el REVISION DEL CAPITULO. valor de res 1 0-1, dependiendo de que la recta tenga pendiente positiva o negativa; un valor de r= 0 indica Ja falta de una relacién lineal y un valor de r cercano a1 0-1 no necesariamente implica una relacién de causalidad. Aprendimos también cémo determinar la ecuacién de regresién usando el método de minimos cuadrados; la suma de los cuadrados de los errores, SSE, se minimiza cuando se usa el método de los minimos cuadrados para calcular la ecuaci6n de re- gresi¢n. cov(x, y), covarianza central Spe coVarianza muestral 1, coeficiente de correlacién ‘SS.y suma de productos cruzados ‘m, pendiente 6, intercepei6n con Covarianza muestral: cov(x, y) = Sxy _ 20-9 0-9) : an Coeficiente de correlacién de Pearson: Lng, n=l Ecuacién de una linea recta: y = b + mx ‘Suma de cuadrados de los errores: SSE=EQ-3F an r (42) m TERMINOS IMPORTANTES = “ Los términos det capitulo se han mezelado para proporcionar una mejor practica de revisi6n; ¢ uno con sus propias palabras; después verifique sus respuesta contra las dadas en el capitulo. error esténdar de estimacion método de los minimos cuadrados ‘nea recta” recta de regresi6n ‘eculaci6n lineal ‘suma de pioductos cfuzados codificacién ecuacién de regresién suma de cuadrados de los errores andlisis de regresién diagrama de dispersion covarianza muestral variable dependiente variable independiente centroide : pendiente ‘dependencia lineal andlisis de correlacién datos bivariados intercepeisn con el eje y linea de mejor ajuste cocficiente de comrelacién de correlaciém espuria 3 Pearson : = SIMBOLOS IMPORTANTES = Sp desviaci6n estindar de x Sy, desviaci6n estandar de y- ™_ HECHOS Y FORMULAS IMPORTANTES. = lefina cada $, valor predicho de y ¢), ertor de prediccién SSE, sumia de cuadrados de los errores elejey : Suma de productos cruzados: $8y = By - FPO) ay Férmula para calcular el coeficiente de correlacién muestral:, SSq YSS.SS, Ecuacién de regresi6n: } = b + mx 46 Error de prediccién: winds [rrr ee Gercicios de repaso = 171 Gril para calcula a summa de Tos) ‘Cuadrados de los errore SSE = 55, ~ mSSq ‘Relaci6n entre ry m: ([BIERCICIOS DE REPASO. 4. Enun intento de determinar la relaci6n entre el monto gastado en una campatiay el nimero de votos recibi- dos durante una elecci6n, se rezabaron los datos si- sguientes: Montogastadoen | 3 4 2 5 1 miles de délares: x Votos recibidos | 14 12 5 (enmiles): y a) Dibuje un diagrama de dispersién. b) Calcule el valor de sy ©) Determine el valor de r. 4) Encuentre la ecuaci6n de regresién de SSE. ©) Prediga el ntimero de votos recibidos sise gastaran 3,500 délares en la campafa 1) {Custos votos més pueden esperarse por cada 1,000 délares adicionales gastados? 8) Dibuje una gratfica de la recta de regresién en el diagrama de dispersi6n. 2, Para estudiar la relaci6n entre el nimero de veces que los estudiantes faltan a clases y sus calificaciones al final del curso, un instructor del grupo 209 de mate- éticas obtavo los datos mostrados aqut: Néimero de faltas Calificacién 1233445620 98 98 88 81 83 76 71 71 85 98 ) Dibuje un diagrama de dispersion. ) Calcule el valor de 5. ‘) Determine el valor de r. 4) Encuentre la ecuacién de regresién y SSE. ©) Prediga la calificacién final si un estudiante ha faltado a tres clases. {En cusnto se supone que se afectard la calificacién final por cada falta adicional? 8) Dibuje una grfica de la recta de regresi6n en el iagrama de dispersién. 43, Estudiantes que presentan examen de admisién (x), imero de inscritos por primera vez (y), en los pasa- dos siete afios en una universidad. Resuelva los inci- 808 con estos datos: 3300 4100 5600 5200 5900 5500 5100 y | 3000 3500 4200 4800 5000 5100 4700 a) Dibuje un diagrama de dispersién. b) Calcule el valor de sy, ©) Determine el valor de r. 4) Encuentre la ecuacién de regresién y SSE. ©) Localice § si x= 5000. (Cudntas inscripciones més pueden esperarse por cada 1000 solicitudes adicionales? 8) Dibuje una gréfica de la recta de regresi6n en el diagrama de dispersi6n. 4, Un biomédico estuclé el efecto de dosis diferentes (x) de un nuevo férmaco en el ritmo cardiaco (y) de los seres humanos. Los resultados para cinco individuos se indican en la tabla siguiente: Dosis (2) 253 354 45 Descensoenel | 8 11 9 16 19 ritmo cardiaco (y) a) Calcule el Valor de re interprete el resultado. ) Encuentre la ecuacién de regresi6n, ©) Encuentre SSE. 4) Determine § six = 3.75. €) Por cada unidad de incremento en la dosis, ,cusl es el descenso predicho en el ritmo cardiaco? Dibuje una grafica de la recta de regresién en el diagrama de dispersién. 172. Andlisis descriptivos de datos bivariados 5, En un andlisis de regresin se determiné la informa- cién siguiente: $= 25.187x— 878.8583 $= 278.5247 52293956 F=515 F= 418.3 n=10. a) Encuentre el valor de r. ) Encuentre SSE. ©) Six=45, determine j. 4) {En cudnto cambiaré } por cada unidad de in- cremento en x? 6. Los datos adjuntos representan las ventas anuales de armas, enbillones de délares, de Estados Unidos alas naciones del Tercer Mundo. Aso [1976 1977 1978 1979 1980 1981 1982_1983 Ventas) 82 98 101 92 64 68 79 97 a) Encuentre la ecuacin de regresi6n para predecir Jas ventas ) Use Ia ecuacién encontrada de la parte a, para. estimar las ventas de Estados Unidos alas naciones del Tercer Mundo para el aiio de 1984. (Sugeren- cia: codifique el aiio usando: x = afio - 1975.) 7. Nueve peces dorados fueron aclimatados a una tem- peratura del agua de 3° C; Iuego fueron sometidos a un incremento gradual de la temperatura del agua para averiguar si el metabolismo esté relacionado con la temperatura; el metabolismo se midi6 contando los parpadeos por minuto. Los datos resultantes se enlis- tan en la tabla adjunta, Niimero promedio de ‘Temperatura °C parpadeos por minuto 50 33.0 15 44.8 100 54.0 12.5 525 15.0 70.2 115 99.8 20.0 1105 22.5 117.0 25.0 129.1 a) Dibuje un diagrama de dispersién. b) Calculer. 6) Encuentre la ecuacién de regresion. 4) Determine SSE. ©) Sila temperatura fuera 0° C, {cuéntos parpadeos por minuto deberfan esperarse? Los datos siguientes son para los ejercicios de revisién 8y9. Distancia al Altura DAP. a bol més cercano (enpies) (en pulgadas) (en pies) t 39 ae 195 n 92 40 69 93 5.0 7 95 105 B 95 90 B 97 8.0 79 98 150 81 104 125 65 107 18.0 60. 17 8. Un guardabosques quiere saber la correlaci6n entre la altura total y el didmetro a la altura de su pecho DAP, de una muestra de élamos temblones. Con los datos, de la tabla determine: a) el valor de r, b) la ecuacién de regresién, ©) SSE. Un guardabosques quiere conocer la correlacién entre el tamafio, medido como el diémetro a la altura de su pecho, y la distancia al érboF més cercano en una muestra de élamos temblones. Refiérase a los datos de lauabla a) Dibuje un diagrama de dispersién. b) Calcule el valor de r. ©) Encuentre la ecuacién de regresiGn para predecir DAP a partir de la distancia al érbol més cercano. 4) Encuentre SSE. 40.Para determinar si estén relacionados el flujo del trénsito, medido en el ntimero de vehfculos por hora, y el contenido de plomo en la vegetacién que crece cerca de las carreteras, se realiz6 un estudio en seis localidades, y se obtuvieron los siguientes datos: Nimero de vehiculos | 103 216 294 402 416 573 Contenido de plomo | 46 74 26.1 372248 387 Encuentre la ecuaciOn de regresién y dsela para predecir cl contenido de plomo de la vegetacién que experiments tun flujo de trdnsito de 300 vehfculos por hora. og F ‘encuentre | sion para el-4rea ) dibuje un diagrama de dispersion; ‘ estime el precio de venta de una casa cuyo impuesto fue de 2,500 délares el ano pasado; 174 © Analisis descriptivos de datos bivariados La tabla adjunta lista los resultados del estudio" Lugar. Estado “Esperanza Enfer- Estilo .Disponi-. Tiempo. Morta- i devida_medad _devida._bilidad perdido lidad 1 Utah 3 ree Te 38 10 1 2, Dakota del Norte 5 4 6 10 18 a4 3. Idaho 10 2 2 2B 10 1 4. Minnesota 2 5 18 3 Me 6 5. Hawail 1 16 35 2 eA 1 6. Vermont 7 6 42 3 37 16 7. Nebraska 6 7 3 7 37 2 8 ~ Colorado 9 9 29 20 Z 5 9. Wyoming 26 3 26 37 9 10 10. Montana 25 7 18 16 B 18 11. Washington " n 22 16 10 B 12. Oregon 14 14 15, 5 18 24 13." Nuevo México. ©‘ 22 412 1 AR oe es OB 14. Wisconsin PECANS Ral ee creeia gine ay 14 15, Dakota del Sur 14 10' > z Bas 16. °..lowa 3 19 Sash 30) % 45 a4 17. Maine 19 7 25 2 AE 28 18. California. 49. 26 31 28 4 7. 19... Massachusefis. 13 3 38 Hod a7 a 20. Alaska 246 a 47 40 3 3 2 Indiana 26 18 18 33 31 31 22... Avizona 21 25 37 28 5 16 | 23. Oklahoma 31 20 12 a 18 32 24. New Hampshire* 14 15 49 n 37 9 25. Kansast 7 35 5 21 31 19 } 26. Texast 31 26 29 45 5 u ; 27. Pennsylvaniat 34 24 24 2 50 39 j 28. Connecticut u 36 38 1 7 20 } "29. Kentucky 41 22 14 25 37 36 I 30. New Jersey 22 28 38 19 18 28 | 31. Missouri 26 31 3 33 45 32 32. Ohio 35 30 26 25 37 30 | 33. Virginia 36 29 38 31 18 7 I 34. Arkansas 29 32 7 35. 37 44 | 35. West Virginia 43 34 9 28 45 a7 | 36. Ilinois 37 37 31 24 3 36 37, Nueva York 29 42 36 7 B 38 38. Louisiana* 50 33 28 47 1B 40 39. Tennessee* 39 4 10 35 37 40 40, Rhode Island. 18 43 45 9 45 26 41. Carolina del Norte 42 40 2. 43 7 40 42. Alabama 45 39 10 46 31 48 43, Maryland 37 49 44 14 18 34 44, Florida 22 46 48. 15 31 45 *Estos estados se unieron Lugar Estado, Esperanza. Enfer- de vida medad Estilo. Disponi- de vida. bilidad 45. Georgia 46 MS 46. Carolina del Sur 49 45 47, Nevada 44 38 48, Michigan 31 50 49. Mississippi 48 44 50, Delaware 40 48 3 18 50 S42 Calcule el coeficiente de correlacién de Pear- son para los rangos de: a) Salud y estilo de vida'en un estado. by Salud y esperanza de vida en un estado. ©) Estilo de vida y tiempo perdido. 4) Disponibilidad y tiempo perdido. ©) Enfermedad y estilo de vda. 4. Recabe informacién de 25 conductores con licen- cia de manejo en el estado donde s¢ localiza su universidad: fecha de naciriento, codificada de 11a 366, y los cltimos tres digitos del ndmero de su licencia de manejo. cir los tres limos digtos de fecha de ee =_EXAMEN DE CONOCIMIENTOS DEL CAPITULO’ wo 1, El ntimero de sentadillas $ que un nitio normal y saludable debe ser capaz de reilizar, con base en su edad x, esté dado por $= 1.4r-0.9, donde 4s x 17. a) {Cudntas sentadillas debe esperarse que haga un hifio de diez afios de edad? b) Cuando la edad aumenta, jcrece 0 decrece el nic ‘mero de sentacillas? ©) (Cudntas sentadillas més debe esperarse que haga un niffo por cada afio de edad? 4) En este caso, gdebe tener lainterceccién con el eje y una interpretaci6n con sentido? Explique. 2. Unestudiode larelacién entre laestatura, en pulgadas, ¥ el peso, en libras, de los universitatios hombres produjo los datos dados aqut. Estatura(x)| 64 72 7368 _66_67 Peso(y) [165 158 173 125 125. 139 Determine lo siguiente: a) Ss, b) ss, OSSy 4) la pendiente, m, ©) lainterceccién con el ejey. b, {la ecuacién de regresién, 2) el coeficiente de correlacién de Pearson, h) SSE, i) } cuando x = 65, Jel error e para el hombre en la muestra cuya esta- tura es x=71 pulgadas. Existe una fuerte correlacién positiva entre los sala- rios de los maestros y el consumo anual de cerveza en Estados Unidos. a) {Significa esto que el aumento en el consumo de cerveza ha sido causa del incremento alos salarios de los maestros? {0 que mientras més bebe un maestro mas pago conseguira? Explique }) {Qué factor(es) adicional(es) pueden causar que los salarios de los maestros y el consumo de cer- veza se incrementen simulténeamente? 176 = Andlisis descriptvos de datos bivariados 4. Como $= b+mx y b=Y—me, tenemos $= (im) Localice la covarianza muestral para los datos parea- +mx. Por tanto, $ ~J= m(x—X). Con la ecuacién de dos: regresién escrita en esta forma, demuestre que el ee centroide (f, ¥) esté en la recta de regresi6n, Sa Euan Sunn aa yli as 21 25 28 5. Encuentre SSE para los datos bivariados siguientes Gy): UNIDAD DOS Probabilidad basica Introducci6n a la probabilidad elemental Distribuciones discretas Distribuciones continuas Introducci6n a la probabilidad elemental : aa : EES — DESCRIPCION OBJETIVOS DEL CAPITULO 5.1 Experimentos y eventos En este capitulo estudiaremos: 5.2 Concepto de probabil > Experimentos. dad > Espacios muestrales 5.3 Conteo > Eventos. 5.4 Cémo encontrar proba- > Qué es un evento compuesto y cémo formar eventos compuestos bilidades usando el teorema Eventos complementarios fundamental del conteo >» mo usar dlagrarnas de Venn para representar eventos 5.5 Algunas reglas de proba- >» Eventos mutuamente excluyentes. bilidad > Probabilidad. 5.6 Eventos independientes > Los métodos de asignar probabilidades. 5.7 Variables aleatorias > Qué son las posibilidades matematicas y cémo calcularlas. EEE] > Teorema fundamental del conteo. > Cémo usar el teorema fundamental del conteo para encontrar probabilidades Qué son las permutaciones y cémo usarlas para contar. Qué son las combinaciones y cémo usarlas para contar. Algunas reglas fundamentals de probabilidad. Eventos independientes. Variables aleatorias Cémo encontrar la media y la varianza de una variable aleatoria. JVVVVVY 180 + Capitulo 5 ntroduccién aa probabilidad elemental Panorama del capitulo | La alta probabilidad de que los resultados positivos sean falsos, se ve como aceptable debido a la baja probabilidad de que sea falso un resultado negative Si la prueba de ELISA se aplica a 10,000 muestras de sangre de una poblacién de alto riesgo, cuya probabilidad de tener la enfermedad es 5/1000, entonces debemos esperar obtener 50 muestras contaminadas; de éstas, 0.98 X 50 = 49 darén una prueba positiva; si las quitamos de Jas 10,000 muestras esperarfamos que 9,950 de ellas no estén conta- minadas, y de éstas 0.07 X 9950 = 696.5 dardn una prueba positi- | va falsa, si usamos la prueba de ELISA. El ntimero de falsas negativas | es0.02 x 50 = 1. El alto niimero de positivas falsas, 696.5; en este caso falsas, 1, asociado con la prueba de ELISA. La probabilidad de que una persona tenga SIDA dado que su sangre dé una prueba positiva es condicional, un tema que se estudiar en la seccién 5.5. Idealmente, se necesita una prueba con un alto valor predictivo para resolver positivo 0 negativo; es decir, si la prueba es positiva entonces es altamente probable que la persona tenga SIDA. Después de estudiar los capftulos siguientes, deberd quedar razonable- mente claro por qué es imposible desarrollar una prueba de SIDA con un valor predictivo del 100 por cient. deberia considerarse aceptable debido al bajo numero de negativas El propésito de este capitulo es desarrollar las ideas bsicas que se necesita- én para una adecuada comprensién de la estadistica inferencial. La estadfs- tica inferencial es un cuerpo de conocimientos que trata los métodos para caracterizar una poblaci6n usando informacién calculada de muestras extrai- das de la misma, Estos métodos siempre conllevan cierto grado de incerti- dumbre. Por ejemplo, podemos hacer las preguntas siguientes: 1 {Cudl es la posibitidad de que cierre la AJAX Company? 2. ¢Cual es el peso promedio de los bebés de un mes de nacidos? 3, Es mejor la marca A que la marca B? Todos los dfas enfrentamos tomas de decisiones y planteamientos proba- bilisticos. Los planteamientos que contienen las palabras posibilidad, plausibi- lidad, oportunidad, parecido, esperado, posible, incierto y probabilidad, se tefieren todos al mismo tema: la incertidumbre. A diario, hacemos u oimos planteamientos como los siguientes: {Cuil es la probabilidad de que tengamos un examen hoy? Las oportunidades de lo golpee un poste del alumbrado son de | en 2 millones. El trabajo se terminaria plausiblemente a tiempo. Las posibilidades de que llueva hoy son del 50 por ciento. Si se arroja una moneda, hay una posibilidad de 50-50 para que salga cara. SECCION 5.1 Experimentos Secin 5.1 Experimentosy eventos» 181 6. {Cuil es la probabilidad de que el nuevo método propuesto lleve a mejores resultados? 7. Tengo confianza en que puedo aprobar este curso. Contamos con un buen concepto intuitivo de la probabilidad; partiendo de esta base, exploraremos algunas de las propiedades no tan obvias de la teoria de la probabilidad para ayudarnos a desarrollar una mejor comprensién de la estadfstica inferencial. La probabilidad nos ofrece el fundamento para desarrollar la ciencia de la estadistica inferencial; mediante la teorfa de la probabilidad, podemos deducir la posibilidad de que aparezcan ciertas ‘muestras con propiedades especfficas. Tal informacién nos permitira obtener inferencias sobre una poblacién. Comenzamos nuestro estudio con una exposicién sobre los experimentos. Experimentos y eventos Un experimentoes cualquier proceso planeado que da lugar a observaciones oarecoleccién de datos; un ejemplo muy simple de un experimento es arrojar un dado y observar el nimero de la cara que queda hacia arriba cuando se detiene; para este experimento habria seis posibles resultados registrados, 1 2, 3,4, 5 0 6. También, el resultado de este experimento puede registrarse como un ntimero par o impar, por eso es importante definir con cuidado la forma del registro, pues la misma situaci6n basica produciria datos que pueden registrarse desde varios puntos de vista. Como otro ejemplo de un experimento, digamos que probamos una muestra de un producto terminado, seleccionada de una Ifnea de ensamble para determinar si el producto es defectuoso 0 no; este experimento tiene dos resultados: el producto es defectuoso 0 no, pero en cualquiera de estas dos situaciones podemos repetir el experimento muchas veces. Para nuestros fines, estaremos interesados principalmente en experimentos que pueden repetirse 0 que se acepte que pueden repetirse. Experimentos como observar si llovera mafiana o determi- nar quién ganaré la serie mundial el afio préximo no son repetibles y no los consideraremos en esta seccién, sino que estaremos interesados con frecuencia enlos resultados obtenidos de repetir un experimento un cierto mimero de veces. Todos los experimentos tienen resultados y la mayor parte de ellos son inciertos y dependen del azar; los resultados de un experimento forman un conjunto llamado espacio muestral. Un espacio muestral de un experimento es la coleccién de todos los resultados posibles. El experimento més simple referente a incertidumbre es uno que tiene dos resultados y un espacio muestral tinico, como vemos en el ejemplo 5.1. Sin 182+ Capitulo 5 introduccién ala probabilidad elemental EJEMPLO 5.1 EJEMPLO 5.2 EJEMPLO 5.3 ‘embargo, un experimento puede tener més de un espacio muestral; es decir, se puede usar més de un espacio muestral para describir los resultados de un experimento. En general, es deseable elegir un espacio muestral que propor- cione la méxima informacién referente al experimento. Considere los ejem. plos 5.2 y 5.3 y la aplicaci6n 5.1 Observar el sexo del siguiente bebé que nazca en el Memorial Hospital es un experimento con dos resultados; un espacio muestral para este experimento consiste en el conjunto S = {H, M), donde H representa a un hombre, M representa a una ‘mujer y las aves se usan para indicar coleccién o conjunto. Si observamos los nacimientos de los siguientes dos bebés nacidos en el Memorial Hospital, entonces un espacio muestral para el experimento podria ser el conjunto S, = (HH, HM, MH, MM), donde, por ejemplo, MH indica que el primer bebé en nacer fue una mujer y el segundo fue un hombre. Otro espacio muestral para este experimento puede consist en el niimero de posibles nacimientos de hombres: S;= (0, 1,2}; note que estos dos espacios muestrales proporcionan informacién diferente Del resultado de sélo un hombre en Ss, no podemos determina si fue el primero el segundo en nacer; para este experimento referente al mismo tema, hemos regis- trado los datos en dos formas distintas. Para el experimento de arrojar un dado, S, = (1, 2, 3,4, 5,6) es un espacio muestra! yeel conjunto S:= (niimero par, ntimero impar} también lo es. Saber que el resultado de un lanzamiento de un dado es par, no posibilita determinar si fue 2, 4 06. Liste un espacio muestral para cada uno de los siguientes experimentos ) Lanzar una moneda de diez centavos y otra de veinte en ese orden, y obser- vvar cémo caen, ) Lanzar una moneda de un peso, una de cinco centavos y otra de diez centa- vos, en ese orden. y observar cémo caen. ©) Seleccionar a una estudiante universitaria al azar y preguntarle cuéntos aiios tiene ) Lanzar primero una moneda, de un lado y abservar cémo cae. ©) Lanzar una moneda hasta que salga dguila Solucién: a) S= (SA, AS, AA, SS}. El resultado SA significa que la moneda de diez centavos muestra el “sol” y lade veinte el “éguila”. b) S= [SSS, SSA, SAS, SAA, ASS, AAS, ASA, AAA). El resultado SAS sig- nifica que el peso muestra el “sol”, la moneda de cinco centavos el éguila y la moneda de diez, el “sol”. ©) S= (10,11, 12, 13, ., 98, 99, 100). @) S={S1, $2, $3, $4, $5, $6, Al, A2, A3, Ad, AS, A6) ©) S={S, AS, AAS, AAAS, AAAAS, etc.). El resultado AAAS significa que salié “sol” en el cuarto lanzamiento, Eventos EJEMPLO 5.4 EJEMPLO 5.5 FIGURA 5.1 Diagrama de Venn que representa el espacio muestral y un evento Sect 5.1 Experimentosy eventos» 183 Para un cierto experimento, podemos estar interesados en determinar la probabilidad de que ocurra una coleccién de resultados, en lugar de la probabilidad de que se dé uno solo. Por ejemplo, cuando se lanzan tres ‘monedas a la vez, podemos estar interesados en los resultados que indiquen que al menos han salido dos “soles”; esta coleccién de resultados, (SSA, SAS, ASS, SSS) se llama un evento. {Un evento es cualquier subcolecci6n (0 subconjunto) de un espacio muestra Suponga que el experimento es lanzar primero un peso y luego una moneda de diez centavos; un espacio muestral para este experimento podria ser S = (SS, SA. AS, ‘AA). Algunos eventos posibles son: E,= (SS) Es=(SS,AA} Ey= (SA) Es= (SA, AS) Ey=(AS} Fa=(AA} Hay 16 eventos posibles. El conjunto vacfo y el espacio muestral S también son eventos; el evento E, puede deseribirse como la obtencién de un éguilaen el peso y tun Aguila en la moneda de diez centavos, y el evento Es puede describirse como la ‘obtencién de dos “soles” o dos “Aguilas”. Un evento simple es un evento que contiene s6lo un resultado. El evento E; = ($S} del ejemplo 5.4 es un evento simple, mientras que el E; no lo es Recuerde que un evento es siempre una coleccién de resultados del universo de todos los resultados identificados como el espacio muestral. Para Tepresentat gréficamente espacios muestrales y relaciones entre eventos se puede usar un diagrama de Venn; se acostumbra que un recténgulo denote el espacio muestral y que los eventos se representen como circulos dentro. del recténgulo, como se indica en la figura 5.1. 184 + Capitule.5 imtcoducci6n a la pobabilidad elemental [[APLICACION 5.2 ‘APLICACION 5.3 ‘Suponga que un experimento consiste en examinar tres fusibles; cada fusible puede ser defectuoso (D) 0 no defectuoso (N), los ocho resultados posibles son (NDD, NDN, NND, NDD, DND, DNN, DDN, DDD}. Anote los resultados que conforman cada uno de los eventos siguientes: I primer fusible estd defectuoso. primer fusible y el dltimo estén defectuosos fodos los fusibles son buenos. 1 menos un fusible esté defectuoso. lo mas un fusible esta defectuoso. Soluci6n: a) E.= (DNN, DND, DDN, DDD} DDD, DND} ob ) 4) Note que al menos uno significa uno o més. E:= (NDD, NDN, NND, DNN, DND. DDN, DDD} @) Note que a lo més uno significa uno 0 menos. Es = {NDN, NND, NNN, DNN). = Considere el experimento de tirar un dado rojo y uno negro, y observar cémo caen; un espacio muestral de 36 resultados posibles es como sigue, donde la primera entrada es el resultado del dado rojo y la segunda el del dado negro. (a. G2) 0.3) 04) G5) 0.6) 20 @2 23) G4) @5) (2,6) BY) 62 B3) G4 65) BO 4D 42) 43) 44) 4S 46) 6D 62 63) G4) 65 6.6) 0 62) 6,3) 6,4) (6.5) (6,6)} El espacio muestral S se puede representar por el siguiente diagrama: c. ce a Dado a negro 2 Dado rojo Seccién 5.1 Experimentosy eventos + 185 Dé una descripcidn para los eventos: a) (0.0.2, 0,8, 0.4 0.6.0.6, D) b) (1), (2,2 3, 3). 4 4), (5,5), (6, 6)) ©) (8,4). (4, 3), 5, 2.02, 5), (6, 1), (1, 6) 4) (6,6), (6, 5)) ® {C.D} 8 (44) Solucién: a) El dado negro muestra el 1 'b) Los dos dados coinciden. ©) La suma de los dados es igual a 7. 4) La suma de los dados es igual a 11 ©) Ambos dados muestran 1 (a.un par de unos se le Lama “ojo de serpiente”). ) Ambos dados muestran un 4 (a un par de cuatros se le conoce como “fur- 6n). APLICACION 5.4 || Para el experimento de lanzar los dados en la aplicacién 5.3, liste los resultados de los eventos siguientes: a) La sumaes par. b) Lasumaes divisible entre 5. ©) La suma es un niimero primo, (Un niimero primo es un niimero mayor que 1, divisible s6lo entre 1 y él mismo.) ) El ndmero del dado negro es dos unidades mayor que el nimero del dado rojo. ©) Lasuma es impar. ) Lasuma noes divisible exactamente entre 5. Solucié a) Los pares siguientes tienen una sunita que es par: (0 0,3) 0,5) @2) 24) 2.6) BD G3) GS 42 44 46 GV 63) GS) 62) 64) 66) b) Estos pares tienen una suma divisible entre 5: {1.4. 4D, 62. 23, 65. 64), 4.6) ©) Y éstos, una suma que es un niimero primo: {0.2. QD. (4. 4D. (L0, 6D, (2.5) (5.2) BA, 43. 6.6 (65), (23), 3.2) 186 + Capitulo 5 tntroduccién a la probabilidad elemental 4d) Los pares siguientes tienen un nimero en el dacio negro que es dos unidades mayor que el del dado rojo: 10,3, 24. GD, 4,6} €) Estos pares tienen una suma que es impar: {,2) (1,4) (1,6) (21) (2,3) (2,5) B2 B4 BH G1 43) 5) G62 64) 6O 6D 6,3) 6,5) 4) Y éstos, una suma que no es divisible entre 5: (AD) 02 3 45) G6 ed 22) 24 25 26 BD 3.3) 34 G35) G6 42 3) 44) 45) 61) 6.2) 6,3) 64) (5,6) 1) 62) 63) (65) 66) = Evento (no 6) Si Bes un evento contenido en un espacio muestral S, entonces el evento no E, denotado por , es el que contiene todos los resultados en $ que noestén contenidos en E. Enel diagrama de Venn de la figura 5.2, E es el érea sombreada dentro de S y fuera de E. FIGURA 5.2 Diagrama de Venn del evento “no E” EJEMPLO 5.6 Considere el experimento de lanzar un dado, Si E es el evento de obtener un 4 0 un 6, entonces el evento E contiene los resultados 1, 2, 3 y 5; esto es, si B= (4, 6), entonces B= (1, 2, 3, 5} Suponga que E es un evento de algiin experimento; como un evento E ocurre 0 no ocurre, un espacio muestral para el experimento es 5 = {E, E); en consecuencia, cualquier experimento tiene un espacio muestral con sélo dos resultados, E y E: Considere la aplicacién 5.5, Secciém 5.1 Esperimentos y eventos» 187 Para cada uno de los siguientes experimentos, liste un espacio muestral con s6lo dos resultados. ) Lanzar una moneda cinco veces y observar el niimero de caras. ) Lanzar una moneda de diez centavos seguida de otra. ©) Girar la aguja y observar dénde se detiene, (Entra esquema, al margen.) Solucién: Para cada experimento anotamos dos de los espacios muestrales posibles con sélo dos resultados. Hay otros espacios muestrales que el estudiante puede obtener. a) Sy = {obtener 5 caras, no obtener 5 caras} S:= {obtener 2 caras, no obtener 2.caras} ) Si = {la suma es par, la suma es impar} S;= {obtener dos veces 3, no obtener dos veces 3}, ©) Si = {se detiene en 1, no se detiene en.1) S:= (se detiene en 2, no se detiene en 2) om Eventos compuestos Como Jos eventos son conjuntos, los operadores de unién y de interseccién pueden usarse para formar eventos compuestos; si E y F son eventos, entonces (EU F) y (E0 F) son ejemplos de eventos compuestos. (Eu Pes elevento de que ocurran E, 0 F, 0 ambos. (EOP) es elovente de que tanto E come F ocurran al mismo tiempo. Se puede usar diagramas de Venn para ilustrar eventos compuestos; en los de la figura 5.3, los eventos compuestos (A U B) y (A > B) estén repre- sentados por las regiones sombreadas. FIGURA 5.3 Diagrama de Venn de eventos compuestos Eipico muesa Blevento AUB 188 + Caphtulo 5 tntroduccién a a probabilidad elemental ee ° os 1 Eno Epucde o E« ccuriré no curr caring La probabilidad satisface las siguientes propiedades: 1. PED 20 2. PENS 1 3.2 PEI donde ZP(Ei) es la suma de las probabilidades para todos los resultados [eventos simples) en el espacio muestra La probabilidad de un evento A se define como la suma de las probabilidades para los resultados contenidos en A. La aplicacién 5.10 muestra cémo asignat probabilidades a eventos una vez que se conocen las de los resultados en él espacio muestral. i i [APLICACION 5.10 Cémo asignar probabilidades a eventos Métodos objetivos EJEMPLO 5.7 ‘Seccién 5.2 Concepto de probabilidad = 193 Suponga que se lanza un dado una vez y la probabilidad de cualquier cara de quedar hacia arriba es 1/6; si E es el evento de sacar un ntimero par y F el de uno impar, encuentre: a) PE), b) PR). ©) PEUP). d) PEP. Solucién: El espacio muestral es S = {1, 2, 3,4, 5, 6), el evento Ees {2,4, 6} y el evento F = (1, 3, 5}. Por tanto, tenemos: a) P(E) = P(2) +P) + P(6) = V6 + 1/6 + U6 = 3/6 = 1/2 b) POF) = PU) + PQ) + PGS) = U6 + 116 + 1/6 = 3/6 = 1/2 0) PEUR=PS)= @) PEA F)=0, puesto queENF=Oy P@)=0. Las tres propiedades que satisfacen las probabilidades no nos dicen como asignarlas a Jos resultados en un espacio muestral; lo que hacen es normar ciertas asignaciones que no son consistentes con nuestras nociones intuitivas. Hay dos métodos generales para asignar probabilidades a eventos: el método objetivo y el étodo subjetivo. El método objetivo implica asignar probabilidades ‘a eventos con base en el conteo o en la experimentacién repetida; el método subjetivo, por otro lado, nos permite asignar probabilidades con fundamento en la intuicién o en la creencia personal; cuando se utiliza el método subjetivo, dos conocedores pueden no concordar en sus asignaciones Se lanza una moneda, Ios resultados serdn cara (C) y éguila (A). {Qué niimero P(C) le asignarfamos aC y cul P(A) Ie asignarfamos a A? Suponga que le asignamos 0.7, a Cy 03 A; es ésta una asignaciGn vélida de probabilidades” La respuesta es sf con base en las propiedades anteriores porque: a) ambos ntimeros son mayores que cero; b) ambos nimeros son menores que 1, y ¢) lasumma de 0.7 y 0.3 es 1; pero estas, asignaciones van en contra de nuestra intuicin si sabemos que la moneda es legal y ‘muchos de nosotros convendrfamos en que lo correcto seria 0.5 paraC y 0.5 para A. Si lanzamos una moneda un gran niimero N de veces y encontramos la frecuencia f para el suceso de una cara, esperariamos que la frecuencia relativa f/N para la ccurrencia de una cara sea cercana a 0.5. La tabla 5.1 contiene el niimero de caras obtenidas en cada caso. Como C y A son los tinicos resultados del experimento, no cuenta que la moneda caiga sobre el canto; entonces P(A) debe ser 0.5 pues asf 05+05=1. 194. Capitulo 5 ntroduccién a la probabilidad elemental TABIA 5.1 Frecuencia y frecuencia relativa de caras en el lanzamiento FIGURA 5.7, Valores limites de IN cuando N se vuelve grande Nem, lanzamientos Nim. “soles” Frecuencia rlativa N f JIN 0.000 0.500 0.333 0.250 0.600 0.500 0571 0.375 0.67 0.400 ipHor waar seers 100 st 0.510 1000 447 0.447 10000 S047 0.505 El valor limite dela frecuencia relativa f/N de la obtencién de un “sol” cuando una ‘moneda legal se lanza N veces, se aproximaré a 0.5 cuando N sea grande, como lo ilustra la figura 5.7, ‘Como 0.7 no es igual al valor limite de ta frecuencia relativa del suceso de un “sol”, que es 0.5, no recomendarfannos asignar 0.7 como probabilidad del resultado C. Con el valor 0.5 asignado a C, {qué probabilidad P(A) debe asignérsele a A? ‘Como consecuencia de la tercera propiedad, sabemos que: PO) +P(A)=1 05+ P(A)=1 Por tanto, P(A) =0.5 debe ser la probabilidad asignada ala obtencién de un “éguila”, £ £ 050 ” 0569 . st ots . 55 0316 . oo oss . 20, 0.486 | 105 ag Mi a7 190 0508 * 254 0516 . 335, n 0510 : 35 0495 4 356 0.505 = 700 30 369 oso : 1065 0.508 b 1290 0.499 1546 0494 4 1835 0503 } 2150 0303 2520 050 ero de veces que una moneda es lanzada Probabilidad empirica EJEMPLO 5.8 be A EJEMPLO 5.9 - MINITAB, puede simular el lanzamiento de una moneda tantas Seccién 5.2 Concepto de probabilidad » 195 Si un experimento es repetible pocemos asignar probabilidades a los resul- tados de acuerdo con los limites de las frecuencias relativas, en forma anéloga como lo hicimos antes para la moneda; el nico problema de hacer esto es que no siempre se conocen Jos valores limite de las frecuencias relativas; para usar este método, necesitamos tener disponibles muchos datos repetiti- ‘os y atin entonces sélo se pueden encontrar aproximaciones de los limites de las frecuencias relativas. Cuando la probabilidad se basa en nuestra experiencia y se desconocen los valores exactos de los limites de las frecuencias relativas, deben usarse aproximaciones a estos valores limite; al hacerlo, al método objetivo de asignaci6n de probabilidades se le lama empfrico. Segdn el método de probabilidad empirica, si E es un evento, P(E) es aproximadamente igual a fIN, donde f es el mimero de resultados favorables y N el de repeticiones del experimento. En este caso, tenemos: ak Pe Consideremos el experimento de bailar una pirinola que puede detenerse de dos maneras 4C6mo podemos determinar la probabilidad de que la pirinola se detenga hacia arriba? Podrfamos preguntarle a alguien, pero, alguien sabria la respuesta? Quizé nadie; podemos bailar la pirinola diez veces y anotar el mimero de veces que queda hacia arriba. Esa frecuencia relativa podria servir como una estimacién de la probabilidad deseada; més atin, para tener una estimacién mejor, podrfamos bailar Ja pirinola 100, 1000 veces o més y anotar la frecuencia de que apunte hacia arriba, de esta manera obtendrfamos una buena aproximacién de la probabilidad de que la pirinola apunte hacia arriba. Segiin cambia nuestra experiencia, cambia la frecuencia relativa. Por ejemplo, si lanza- ‘mos una moneda seis veces y obienemos tes cara, estimarfamos que la posibilidad de obtener una cara es 3/6 = 0.5; sila moneda fuera lanzada una vez més y mostrara una cara, entonces la posibilidad estimada de obtener tna cara serfa 4/7 = 0.5714, 0 si fuese cruz la posibilidad estimada de obtener cara serfa 3/7 = 0.4286; este cambio en Ja frecuencia relativa refleja el cambio de nuestro conocimiento. Como lo sefialamos antes, cuando la repeticién aumenta, la frecuencia relativa cambia muy poco y el valor limite al que se aproxima se le denomina probabilidad, isted tiene acceso a un programa de computadora como, veces como quiera; a esto se le lama simulacién por computadora, Las primeras dos lineas en la pantalla 5.1 usan MINITAB para hacer que la computadora simule un proceso aleatorio de 150 lanzamientos de una moneda legal, y exhiba los resultados en una columna etiquetada con C1; entonces los 196 + Captulo 5 ntroduccién a la probabilidad elemental Pantalla 5.1 resultados de los lanzamientos simulados se imprimen, seguidos de un recuento de todos ellos, Los resultados de los primeros 15 lanzamientos se muestran en la primera columna de unos y ceros; cada 1 representa un “sol” y cada 0 un “Aguila”; si usamos solo los primeros 15 lanzamientos de la moneda para estimar la probabilidad de obtener un “sol” en un solo lanzamiento, la P(sol) estimada seria 7/15 = 0.467. Si leemos de la cuenta dada al final de | la pantalla, vemos que la simulacién produjo 69 soles y 81 “Aguilas” basados en 150 lanzamientos, P(sol) = 69/150 = 0.46. Otra simulaci6n produciria, en general, resultados diferentes. MTB> RANDOM 150 Cl: SUBC> BERNOULLI P = 05, MTB> PRINT CL a 1 o 1 1 0 1 1 1 1 ° MTB>TALLY Cl; SUBC> ALL, CL COUNT CUMCNT PERCENT cUMECT 0 81 8154.00 54.00 1 6 150 46.00 100.00 N=150 MTB> ‘Una compaiifa de seguros quiere estimar la probabilidad de que le ocurra un accidente a un coche de Ia policfa en una cierta ciudad durante un periodo de un mes; el tiltimo mes, 7 de 20 coches de la policfa tuvieron accidentes. a) {Cul serfa la estimacién dada por usted de Ia probabilidad deseada? ) {Cudl es la probabilidad de que un coche de Ia policfa no participe en un accidente? Solucién: a) 7120=0.24 >) 0651-035. = Poe Seccién 5.2 Concepto de probabilidad = 197 ‘APLICACION 5.12. | Las calificaciones del SAT en mateméticas de los estudiantes de una gran universidad se muestran en la tabla siguiente de frecuencias agrupadas. Tabla 5.2 Tabla de ‘recuencias relativas agrupada para la aplicacién 5.12 APLICACION 5.13 T 200-299 300-399 400-499 500-599 600-699 700-799 fi 3,600 11,900 12,000 5,500 1,500 500 Si se elige a un estudiante al azar, jcusl es la probabilidad de que la calificacién del estudiante en matemdticas en el SAT a) exceda de 399? ) sea.alo més 599? ©) esté entre 600 y 699, inclusive? 4) noesté entre 400 y 499, inclusive? €) sea menor o igual que 6997 Solucién: Primero construimos una tabla de frecuencias relativas agrupa- das, tabla 5.2. Los célculos se aproximaron hasta la tercera fra decimal; recuerde que la frecuencia relativa de una clase se encuentra dividiendo la frecuencia f de la clase entre el nimero total de medidas N. SAT 200-299 300-399 400-499 500-599 600-699 700-799 a) PISAT > 399) ©) P(600< SAT < 699) = 0.043. f 3,600 11,900 12,000 5,500 1,500 500, 35,000 Rel F 0.103 0.340 0.343 0.157 0.043 0.014 343 +0.157 + 0.043 +0.014 = 0.557 b) PISAT < 599) = 0.103 + 0.340 + 0.343 +0.157 = 0.943, ) P(SAT < 400 0 SAT > 499) = 1 ~ 0.343 = 0.657 (pues la suma de las frecuencias relativas es 1). ©) PSAT s 699) esl). om = 0.014 = 0.986 (pues la suma de las frecuencias relativas En una pequefia ciudad, se clasifics a cada persona de acuerdo con su religin y su afiliacién a una partido politico. Los resultados se resumen en Ia siguiente tabla: 198 + Capitulo 5 tntroduccié ala probabilidad elemental TABIA 5. Totales por columna y | renglén para la aplicacién 5.13 u Probabilidad clasica Partido politico Religin __Demécrata__Republicano Independiente Protestante 10,000 8,000 2,000 Judio 5,500 6,000 500 Catélico 8,500 9,500 1,500 Si se escoge al azar a una persona de la ciudad, ;cual es la probabilidad de que la persona sea 4) republicana? b) cat6tica? ©) protestante y republicana? @) catdlicae independiente? Soluci6n: Primero encontramos el total de cada renglén y columna, como se indica en la tabla 5.3. Partido politico Religién __Demécrata__Republicano Independiente Total Protestante 10,000 8,000 2,000 20,000 Judio 5,500 6,000 500 12,000 Cat6lico 8,500 9,500 1,500 19,500 Total 24,00 23,500 4,000 51,500 a) Hay 23,500 republicanos del total de 51,500 personas. Por lo canto, P(R) = 23,500/51,500 = 0.456. 'b) Hay 19,500 catdlicos de ese total. Par tanto, P(C) = 19,500/51,500 = 0.379, ©) Hay 8,000 personas del mismo total que son protestantes y republicanos. Por tanto, P(P y R) = 8,000/51,500 = 0.155. 4) Hay 1,500 personas de las 51,500 que son catélicos e indeps tanto, P(C el) = 1,500/51,500= 0.029, lentes, Por Si en un experimento todos los resultados tienen la misma probabilidad de ocurtir, se dice que son resultados igualmente posibles. Si un experimento tiene m resultados que creemos igual mente posibles, podemos esignar a cada uno en el espacio muestral S, un valor de probabilidad de 1/n; ésta es una consecuencia de la propiedad 3 de la probabilidad, que establece que la suma de las probabilidades para un espacio muestral debe ser 1; entonces si Ees un evento que contiene f resultados de un espacio muestral ccnstituido por n resultados igualmente posibles, la probabilidad de que ocurra E es simple- mente fin. En consecuencia, tenemos el hecho bésico siguiente: Si Ses un espacio muestral de tesultados igualmente posibles y E es un evento, entonces: peat 6»)

Potrebbero piacerti anche