Sei sulla pagina 1di 311

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS


Con el soporte de MATLAB para clculos y grficos estadsticos

Luis Rodrguez Ojeda lrodrig@espol.edu.ec

Instituto de Ciencias Matemticas Escuela Superior Politcnica del Litoral, ESPOL Guayaquil, Ecuador 2007

MATLAB marca registrada de The Math Works, Inc

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

CONTENIDO
1 Introduccin 1.1 Objetivo de la Estadstica 1.2 Origen de la Estadstica 1.3 Definiciones bsicas 1.4 Desarrollo de un proyecto estadstico Estadstica descriptiva 2.1 Recopilacin de datos 2.2 Descripcin de conjuntos de datos 2.3 Tabla de distribucin de frecuencia 2.4 Representacin grfica de conjuntos de datos 2.4.1 Histograma 2.4.2 Polgono de frecuencia 2.4.3 Ojiva 2.4.4 Grficos de frecuencia con formas especiales 2.5 Medidas de tendencia central 2.5.1 Media muestral 2.5.2 Moda muestral 2.5.3 Mediana muestral 2.6 Medidas de dispersin 2.6.1 Rango 2.6.2 Varianza muestral 2.6.3 Desviacin estndar muestral 2.7 Medidas de posicin 2.7.1 Cuartiles 2.7.8 Deciles 2.7.9 Percentiles 2.8 Coeficiente de variacin 2.9 Frmulas para datos agrupados 2.10 Instrumentos grficos adicionales 2.10.1 Diagrama de caja 2.10.2 Diagrama de puntos 2.10.3 Diagrama de Pareto 2.10.4 Diagrama de tallo y hojas 2.11 Muestras bivariadas 2.11.1 Correlacin 2.11.2 Coeficiente de correlacin lineal 2.11.3 Matriz de varianzas y covarianzas 2.11.4 Matriz de correlacin Fundamentos de la teora de la probabilidad 3.1 Experimento estadstico 3.2 Espacio muestral 3.3 Eventos 3.4 Sigma-lgebra 3.5 Tcnicas de conteo 3.6 Permutaciones 3.6.1 Permutaciones con todos los elementos 3.6.2 Arreglo circular 3.6.3 Permutaciones con elementos repetidos 3.7 Combinaciones 3.8 Probabilidad de eventos 3.8.1 Probabilidad de los elementos de un evento 7 8 8 8 9 11 11 11 12 15 15 16 16 17 20 20 20 20 21 21 21 22 22 22 23 23 23 26 30 30 30 30 31 34 35 35 36 36 40 40 40 41 41 42 44 45 45 45 47 50 52

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

3.9 3.10 3.11 3.12 3.13 3.14 4

Axiomas de probabilidad de eventos Probabilidad condicional Eventos independientes Regla multiplicativa de la probabilidad Probabilidad total Frmula de Bayes

52 56 59 60 64 66 68 69 71 74 75 76 76 77 78 78 78 80 80 80 80 81 81 81 81 83 83 86 86 86 87 87 89 89 90 91 94 95 95 95 96 97 98 101 102 102

Variables aleatorias discretas 4.1 Distribucin de probabilidad 4.2 Distribucin de probabilidad acumulada 4.3 Valor esperado 4.3.1 Valor esperado de expresiones 4.3.2 Propiedades del valor esperado 4.3.3 Corolarios 4.4 Varianza 4.4.1 Frmula alterna para calcular la varianza 4.4.2 propiedades de la varianza 4.4.3 Corolarios 4.5 Momentos 4.5.1 Momentos alrededor del origen 4.5.2 Momentos alrededor de la media 4.5.3 Coeficientes 4.5.4 Valores referenciales 4.5.5 Equivalencia entre momentos 4.6 Funcin generadora de momentos 4.6.1 Obtencin de momentos 4.6.2 Propiedad de unicidad 4.7 Teorema de Chebyshev Distribuciones de probabilidad discretas 5.1 Distribucin discreta uniforme 5.1.1 Media y varianza 5.2 Distribucin de Bernoulli 5.3 Distribucin binomial 5.3.1 Parmetros y variable 5.3.2 Distribucin de probabilidad acumulada 5.3.3 Grfico de la distribucin binomial 5.3.4 Media y varianza 5.4 Distribucin binomial negativa 5.4.1 Media y varianza 5.5 Distribucin geomtrica 5.5.1 Media y varianza 5.6 Distribucin hipergeomtrica 5.6.1 Media y varianza 5.7 Aproximacin de la distribucin hipergeomtrica con la distribucin binomial 5.8 Distribucin de Poisson 5.8.1 Media y varianza de la distribucin de Poisson 5.9 Aproximacin de la distribucin binomial mediante la distribucin de Poisson Variables aleatorias continuas 6.1 Funcin de densidad de probabilidad 6.2 Funcin de distribucin 6.3 Media y varianza 6.3.1 Propiedades de la media y la varianza

104 104 105 108 108

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

6.3.2 6.4 6.5 7

Valor esperado de expresiones con una variable aleatoria continua Momentos y funcin generadora de momentos Teorema de Chebyshev

109 109 110 111 111 111 112 114 115 117 119 119 123 124 125 126 127 130 130 131 131 132 133 133 133 133 137 139 139 139 139 140 142 143 144 147 147 147 148 149 150 152 155 155 156 159 160 160 162 164 165 166

Distribuciones de probabilidad continuas 7.1 Distribucin discreta uniforme 7.1.1 Media y varianza 7.1.2 Funcin de distribucin de probabilidad 7.2 Distribucin normal 7.2.1 Distribucin normal estndar 7.2.2 Estandarizacin de la distribucin normal 7.2.3 Valores referenciales de la distribucin normal 7.3 Aproximacin de la distribucin binomial con la distribucin normal estndar 7.4 Distribucin gamma 7.4.1 Media y varianza 7.5 Distribucin exponencial 7.5.1 Media y varianza 7.5.2 Una aplicacin de la distribucin exponencial 7.6 Distribucin de Weibull 7.6.1 Media y varianza 7.7 Razn de falla 7.8 Distribucin beta 7.8.1 Media y varianza 7.9 Distribucin de Erlang 7.9.1 Media y varianza 7.10 Distribucin ji-cuadrado 7.10.1 Media y varianza 7.11 Distribucin emprica acumulada Distribuciones de probabilidad conjunta 8.1 Caso discreto bivariado 8.1.1 Distribucin de probabilidad conjunta 8.1.2 Distribucin de probabilidad acumulada 8.1.3 Distribuciones de probabilidad marginal 8.1.4 Distribuciones de probabilidad condicional 8.1.5 Variables aleatorias discretas independientes 8.2 Caso discreto trivariado 8.3 Caso continuo bivariado 8.3.1 Densidad de probabilidad conjunta 8.3.2 Distribucin de probabilidad acumulada conjunta 8.3.3 Densidades de probabilidad marginal 8.3.4 Densidades de probabilidad condicional 8.3.5 Variables aleatorias continuas independientes 8.4 Caso continuo trivariado 8.5 Distribucin multinomial 8.5.1 Media y varianza 8.6 Distribucin hipergeomtrica multivariada 8.7 Media para variables aleatorias conjuntas bivariadas 8.7.1 Casos especiales 8.8 Covarianza para variables aleatorias conjuntas bivariadas 8.8.1 Signos de la covarianza 8.8.2 Matriz de varianzas y covarianzas 8.8.3 Coeficiente de correlacin lineal 8.8.4 Matriz de correlacin

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

8.9 8.10 9

Media y varianza para variables aleatorias conjuntas trivariadas Propiedades de las variables aleatorias conjuntas

166 171 173 174 175 176 178 178 180 180 182 182 184 184 188 188 188 188 189 189 189 197 197 199 200 201 203 205 208 209 213 215 216 217 218 218 227 227 228 229 232 232 233 236 236 238 240 242 246 247

Distribuciones de muestreo 9.1 Distribucin de muestreo de la media muestral 9.1.1 Correccin de la varianza 9.2 Teorema del lmite central 9.3 La distribucin T 9.3.1 Grfico de la distribucin T 9.4 La distribucin ji-cuadrado 9.4.1 Grfico de la distribucin ji-cuadrado 9.5 Distribucin F 9.5.1 Grfico de la distribucin F 9.6 Estadsticas de orden 9.6.1 Densidad de probabilidad de las estadsticas de orden Estadstica inferencial 10.1 Inferencia estadstica 10.2 Mtodos de inferencia estadstica 10.2.1 Estimacin puntual 10.2.2 Estimacin por intervalo 10.2.3 Prueba de hiptesis 10.3 Propiedades de los estimadores 10.4 Inferencias relacionadas con la media 10.4.1 Estimacin puntual (muestras grandes) 10.4.2 Tamao de la muestra (muestras grandes) 10.4.3 Estimacin por intervalo (muestras grandes) 10.4.4 Intervalos de confianza unilaterales (muestras grandes) 10.4.5 Estimacin puntual (muestras pequeas) 10.4.6 Estimacin por intervalo (muestras pequeas) 10.5 Prueba de hiptesis 10.5.1 Prueba de hiptesis relacionada con la media (muestras grandes) 10.5.2 Prueba de hiptesis relacionada con la media (muestras pequeas) 10.5.3 Valor-p de una prueba de hiptesis 10.5.4 Clculo del error tipo I 10.5.5 Clculo del error tipo II 10.5.6 Curva caracterstica de operacin 10.5.7 Potencia de la prueba 10.6 Inferencias relacionadas con la proporcin (muestras grandes) 10.6.1 Estimacin puntual 10.6.2 Estimacin por intervalo 10.6.3 Prueba de hiptesis 10.7 Inferencias relacionadas con la varianza 10.7.1 Intervalo de confianza 10.7.2 Prueba de hiptesis 10.8 Inferencias relacionadas con la diferencia de dos medias 10.8.1 Estimacin puntual e intervalo de confianza (muestras grandes) 10.8.2 Prueba de hiptesis (muestras grandes) 10.8.3 Intervalo de confianza (muestras pequeas) 10.8.4 Prueba de hiptesis (muestras pequeas) 10.7 Inferencias para la diferencia entre dos proporciones (muestras grandes) 10.7.1 Intervalo de confianza

10

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.8

10.9 10.10 10.11

10.12

10.7.2 Prueba de hiptesis Inferencias para dos varianzas 10.8.1 Intervalo de confianza 10.8.2 Prueba de hiptesis Prueba para la diferencia de medias con muestras pareadas 10.9.1 Prueba de hiptesis Tablas de contingencia 10.10.1 Prueba de hiptesis Pruebas de bondad de ajuste 10.11.1 Prueba ji-cuadrado 10.11.2 Prueba de Kolmogorov-Smirnov Anlisis de varianza 10.12.1 Tabla ANOVA 10.12.2 Prueba de hiptesis

247 249 249 250 252 252 255 256 259 259 263 267 268 268 271 273 274 275 276 277 278 278 279 279 280 280 280 281 281 282 282 287 288 288 289 292 293 293 294 294 295 296 296 296 297 298 302 303 305 306 307 308 309

11

Regresin lineal simple 11.1 Recta de mnimos cuadrados 11.2 Coeficiente de correlacin 11.3 Anlisis del modelo de regresin lineal simple 11.4 Anlisis de varianza 11.5 Coeficiente de determinacin 11.6 Tabla ANOVA 11.7 Prueba de dependencia lineal del modelo 11.8 Estimacin de la varianza 11.9 Inferencias con el modelo de regresin lineal 11.10 Inferencias acerca de la pendiente de la recta 11.10.1 Intervalo de confianza 11.10.2 Prueba de hiptesis 11.11 Inferencias para la intercepcin de la recta 11.11.1 Intervalo de confianza 11.11.2 Prueba de hiptesis 11.12 Prueba de la normalidad del error

12

Regresin lineal mltiple 12.1 Mtodo de mnimos cuadrados 12.2 Mtodo de mnimos cuadrados para k = 2 12.3 Regresin lineal mltiple en notacin matricial 12.4 Anlisis de varianza 12.5 Coeficiente de determinacin 12.6 Tabla ANOVA 12.7 Prueba de dependencia lineal del modelo 12.8 Estimacin de la varianza 12.9 Matriz de varianzas y covarianzas 12.10 Inferencias con el modelo de regresin lineal 12.10.1 Estadsticos para estimacin de parmetros 12.10.2 Intervalos de confianza 12.10.3 Prueba de hiptesis 12.11 Prueba de la normalidad del error Anexos 1 Alfabeto griego 2 Tabla de la distribucin normal estndar 3 Tabla de la distribucin T 4 Tabla de la distribucin ji-cuadrado 5 Tabla de la distribucin F 6 Tabla para la prueba de Kolmogorov-Smirnov 7 Descripcin de los utilitarios DISTTOOL y RANDTOOL

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS


Con el soporte de MATLAB para clculos y grficos estadsticos

INTRODUCCIN

Esta obra es una contribucin dedicada a los estudiantes que toman un primer curso de Probabilidad y Estadstica a nivel universitario en las carreras de ingeniera. El pre-requisito es el conocimiento del clculo diferencial e integral y alguna experiencia previa con el programa MATLAB para aprovechar el poder de este instrumento computacional como soporte para los clculos y grficos estadsticos. El contenido se basa en la experiencia desarrollada en varios aos impartiendo el curso de Estadstica para estudiantes de ingeniera de la ESPOL, y especialmente en el curso en modalidad a distancia que ofrece el Instituto de Ciencias Matemticas como una opcin para los estudiantes que por dificultades en el horario de clases no pueden tomar los cursos en el horario regular. Esta obra contiene todo el material del curso de Estadstica para las carreras de ingeniera en la ESPOL con muchos ejemplos desarrollados basados en temas propuestos en exmenes recientes, sin embargo solo pretende ser el segundo texto para esta materia pues el primero est por concluir bajo la responsabilidad del MSc. Gaudencio Zurita profesor principal de esta ctedra. Esta obra es un aporte para que los estudiantes aprecien el uso de un instrumento computacional moderno y flexible que en forma integradora puede ser usado como soporte comn para todos los cursos bsicos de matemticas, incluyendo lgebra Lineal, Clculo Diferencial e Integral, Ecuaciones Diferenciales, Anlisis Numrico, y ahora tambin Estadstica. Para el manejo estadstico MATLAB dispone de un amplio repertorio de funciones especiales. Todos los clculos en esta obra, incluyendo el manejo matemtico simblico, fueron realizados con estas funciones, asimismo los grficos estadsticos. Sin embargo por el alcance del curso no se utilizaron las funciones ms importantes de este paquete y que en cursos especializados de estadstica se deberan aprovechar. En este sentido la obra es una introduccin al uso de este extraordinario instrumento computacional. MATLAB tiene un sistema de ayuda y documentacin extenso. Al final de esta obra se incluye la descripcin de dos instrumentos computacionales interactivos para experimentar con modelos de probabilidad y con la generacin de muestras aleatorias. El segundo objetivo principal de esta obra es contribuir al desarrollo de textos virtuales en la ESPOL, de tal manera que puedan ser usados frente a un computador pero que tambin puedan imprimirse totalmente o en partes, reduciendo costos y el uso de papel. El texto ha sido compilado en formato pdf. El tamao del texto en pantalla es controlable, contiene dos ndices dinmicos para simplificar la navegacin y facilidades para agregar y borrar digitalmente resaltadores de texto, comentarios, notas, enlaces, revisiones, bsqueda por contenido, etc. Finalmente, debo agradecer a la ESPOL por facilitar a sus profesores desarrollar actividades acadmicas, y mencionar que esta obra tiene derechos de autor pero es de libre distribucin. Luis Rodrguez Ojeda Instituto de Ciencias Matemticas Escuela Superior Politcnica del Litoral, ESPOL Guayaquil, Ecuador

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

1.1

OBJETIVO DE LA ESTADSTICA

El objetivo fundamental de la estadstica es analizar datos y transformarlos en informacin til para tomar decisiones.

1.2

ORIGEN DE LA ESTADSTICA

El origen de la Estadstica se remonta a pocas en las que los gobernantes requeran tcnicas para controlar a sus propiedades y a las personas. Posteriormente, el desarrollo de los juegos de azar propici el estudio de mtodos matemticos para su anlisis los cuales con el tiempo dieron origen a la Teora de la Probabilidad que hoy es el sustento formal de la Estadstica. El advenimiento de la informtica ha constituido el complemento adecuado para realizar estudios estadsticos mediante programas especializados que facilitan enormemente el tratamiento y transformacin de los datos en informacin til. La Estadstica ha alcanzado un nivel de desarrollo muy alto y constituye actualmente el soporte necesario para todas las ciencias y para la investigacin cientfica, siendo el apoyo para tomar decisiones en un entorno de incertidumbre. Es importante resaltar que las tcnicas estadsticas deben usarse apropiadamente para que la informacin obtenida sea vlida.

1.3

DEFINICIONES PRELIMINARES

ESTADSTICA
Ciencia inductiva que permite inferir caractersticas cualitativas y cuantitativas de un conjunto mediante los datos contenidos en un subconjunto del mismo.

POBLACIN
Conjunto total de individuos u objetos con alguna caracterstica que es de inters estudiar.

MUESTRA
Subconjunto de la poblacin cuya informacin es usada para estudiar a la poblacin

VARIABLE
Alguna caracterstica observable de los elementos de una poblacin y que puede tomar diferentes valores.

DATO
Es cada valor incluido en la muestra. Se lo puede obtener mediante observacin o medicin

PARMETRO
Es alguna caracterstica de la poblacin en estudio y que es de inters conocer.

EXPERIMENTO ESTADSTICO
Es un proceso que se disea y realiza para obtener observaciones.

VARIABLE ALEATORIA
Es una variable cuyo valor es el resultado de un experimento estadstico

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

ESPACIO MUESTRAL
Conjunto de todos los posibles resultados que se pudiesen obtener de un experimento estadstico

MODELO
Descripcin simblica o fsica de una situacin o sistema que se desea estudiar

MODELO DETERMINSTICO
Representacin exacta de un sistema. Permite obtener respuestas precisas Ejemplo: una ecuacin matemtica de la cual se obtiene un resultado para algunos valores asignados a las variables.

MODELO PROBABILISTICO
Representacin de un sistema que incluye componentes aleatorios. Las respuestas obtenidas se expresan en trminos de probabilidad. Ejemplo: un modelo para predecir el comportamiento de las colas que forman las personas frente a una estacin de servicio.

ESTADSTICA DESCRIPTIVA
Tcnicas para recopilar, organizar, procesar y presentar datos obtenidos en muestras.

ESTADSTICA INFERENCIAL
Tcnicas para obtencin de resultados basados en la informacin contenida en muestras.

INFERENCIA ESTADSTICA
Es la extensin a la poblacin de los resultados obtenidos en una muestra

1.4

DESARROLLO DE UN PROYECTO ESTADSTICO


Definicin Estadstica Descriptiva Estadstica Inferencial Resultados

Problema

En forma resumida, se describen los pasos para resolver un problema usando las tcnicas estadsticas

PROBLEMA
Es una situacin planteada para la cual se debe buscar una solucin.

DEFINICIN
Para el problema propuesto deben establecerse los objetivos y el alcance del estudio a ser realizado considerando los recursos disponibles y definiendo actividades, metas y plazos. Se debe especificar la poblacin a la cual est dirigido el estudio e identificar los parmetros de inters as como las variables que intervienen. Se deben formular hiptesis y decidir el nivel de precisin que se pretende obtener en los resultados. Deben elegirse el tamao de la muestra y las tcnicas estadsticas y computacionales que sern utilizadas.

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

ESTADSTICA DESCRIPTIVA
Es el uso de las tcnicas para obtener y analizar datos, incluyendo el diseo de cuestionarios en caso de ser necesarios. Se debe usar un plan para la obtencin de los datos.

ESTADSTICA INFERENCIAL
Son las tcnicas estadsticas utilizadas para realizar inferencias estadsticas que permiten validar las hiptesis propuestas.

RESULTADOS
Los resultados obtenidos deben usarse para producir informacin que sea til para la toma de decisiones.

NOTA IMPORTANTE
La metodologa de diseo en otros mbitos de la ciencia e ingeniera usa la retroalimentacin para corregir las especificaciones con las que se ejecutan las actividades, hasta que los resultados obtenidos concuerden con las especificaciones y requerimientos iniciales. Sin embargo, el uso de retroalimentacin en la resolucin de un problema estadstico podra interpretarse como un artificio para modificar los datos o la aplicacin de las tcnicas estadsticas para que los resultados obtenidos concuerden con los requerimientos e hiptesis formuladas inicialmente. En este sentido, usar retroalimentacin no sera un procedimiento tico.

PREGUNTAS
Conteste en no ms de dos lneas de texto cada pregunta 1) En que situaciones las tcnicas estadsticas constituyen un soporte importante? 2) Cual es el aporte de la informtica para el uso de las tcnicas estadsticas? 3) Por que hay que tener precaucin en el uso de los resultados estadsticos? 4) Cual es la diferencia entre poblacin y muestra? 5) Cual es la caracterstica principal de un modelo probabilstico? 6) Cual es el objetivo de realizar una inferencia estadstica? 7) Est de acuerdo con el esquema propuesto para realizar un proyecto estadstico? 8) Est de acuerdo con la interpretacin dada para la retroalimentacin en la resolucin de un problema estadstico?

10

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

ESTADSTICA DESCRIPTIVA

Es el estudio de las tcnicas para recopilar, organizar y presentar de datos obtenidos en un estudio estadstico para facilitar su anlisis y aplicacin.

2.1

RECOPILACIN DE DATOS

Fuentes de datos 1) Investigacin en registros administrativos: INEC, Banco Central, Cmaras de la Produccin, Universidades, etc. para obtener ndices de empleo, ndice de precios, datos de salud, datos de eficiencia, etc. 2) Obtencin de datos mediante encuestas de investigacin Ej. Estudios de mercado. Estudios de preferencia electoral, etc 3) Realizacin de experimentos estadsticos Criterios para disear una encuesta de investigacin 1) Definir el objetivo del estudio 2) Definir la poblacin de inters 3) Determinar el tamao de la muestra 4) Seleccionar el tipo de muestreo 5) Elegir temas generales 6) Elaborar el formulario para la encuesta: Preguntas cortas, claras y de opciones. 7) Realizar pruebas 8) Realizar la encuesta Tipos de datos Los resultados que se obtiene pueden ser 1) Datos cualitativos: corresponden a respuestas categricas Ej. El estado civil de una persona 2) Datos cuantitativos: corresponden a respuestas numricas Ej. La edad en aos. Los datos cuantitativos pueden ser 1) Discretos: Se obtienen mediante conteos 2) Continuos: Se obtienen mediante mediciones

2.2

DESCRIPCIN DE CONJUNTOS DE DATOS


Los datos obtenidos se los puede representar de diferentes formas: 1) Tabularmente. 2) Grficamente 3) Mediante nmeros

Si la muestra contiene pocos datos, se los puede representar directamente, pero si el nmero de datos es grande conviene agruparlos para simplificar su anlisis

11

Ing. Luis Rodrguez Ojeda, MSc

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2.3

TABLA DE DISTRIBUCIN DE FRECUENCIA

Es un dispositivo para agrupacin de datos y facilitar su interpretacin. Recomendaciones para construir la Tabla de Frecuencia 1) Identificar la unidad de medida de los datos 2) Obtener el rango de los datos, R R = mayor valor menor valor 3) Seleccionar el numero de clases (o intervalos) k, para agrupar los datos. Sugerencia para elegir k Sean n: nmero de datos k: Nmero de clases n Menos de 50 Entre 50 y 100 Entre 100 y 250 Mas de 250 k 5a7 6 a 10 7 a 12 10 a 20

4) Obtener la amplitud de las clases, Amplitud = R/k Se puede redefinir la amplitud, el nmero de clases y los extremos de cada clase de tal manera que las clases tengan la misma amplitud, incluyan a todos los datos y los valores en los extremos de las clases sean simples 5) Realizar el conteo de datos para obtener la frecuencia en cada clase Notacin n: k: fi: fi/n: Fi: Fi/n: mi :

nmero de datos nmero de clases frecuencia de la clase i, i=1, 2, 3, , k frecuencia relativa de la clase i frecuencia acumulada de la clase i Fi = f1+f2+f3++fi frecuencia acumulada relativa de la clase i marca de la clasei (es el centro de la clase i)

Los resultados se los organiza en un cuadro denominado Tabla de Frecuencia

Ejemplo.- Los siguientes 40 datos corresponden a una muestra del tiempo que se utiliz para atender a las personas en una estacin de servicio: 3.1 4.9 2.8 3.6 4.5 3.5 2.8 4.1 2.9 2.1 3.7 4.1 2.7 4.2 3.5 3.7 3.8 2.2 4.4 2.9 5.1 1.8 2.5 6.2 2.5 3.6 5.6 4.8 3.6 6.1 5.1 3.9 4.3 5.7 4.7 4.6 5.1 4.9 4.2 3.1 Obtener la tabla de frecuencia

12

Ing. Luis Rodrguez Ojeda, MSc

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Solucin 1) Precisin: un decimal 2) Rango: R = mayor valor menor valor = 6.2 1.8 = 4.4 3) Nmero de clases: k=6 4) Amplitud: R/k = 0.7333.. Por simplicidad se redefine la amplitud como 1 y se usan nmeros enteros para los extremos de las clases. 5) Conteo de los datos (puede hacerse en un solo recorrido de los datos con la ayuda de cuadritos para conteo (de 5 en 5) Clase Intervalo Frecuencia 1 [1, 2) 1 2 [2, 3) 9 3 [3, 4) 11 4 [4, 5) 12 5 [5, 6) 5 6 [6, 7) 2 n = 40 Tabla de Frecuencia Clase i 1 2 3 4 5 6 Intervalo [a, b) [1, 2) [2, 3) [3, 4) [4, 5) [5, 6) [6, 7) Marca Frecuencia de clase m f 1.5 2.5 3.5 4.5 5.5 6.5 1 9 11 12 5 2 Frecuencia relativa f/n 0.025 0.225 0.275 0.300 0.125 0.050 Frecuencia acumulada F 1 10 21 33 38 40 Frecuencia acumulada relativa F/n 0.025 0.250 0.525 0.825 0.950 1.000

EJERCICIOS
1) Conteste las siguientes preguntas en no ms de dos lneas de texto a) En las fuentes de recopilacin de datos no se ha mencionado el uso de internet.Cuales son las ventajas y peligros de su uso? b) Al disear el formulario de una encuesta de investigacin. Por que se prefieren preguntas con opciones para elegir? c) El nmero telefnico de una persona. Es un dato cualitativo o cuantitativo? d) El dinero es un dato cuantitativo, Discreto o continuo? 2) Con los resultados obtenidos y descritos en la tabla de frecuencia del ejemplo desarrollado en esta seccin, conteste las siguientes preguntas a) Cuntas personas requirieron no ms de 4 minutos para ser atendidas? b) Cuntas personas requirieron entre 2 y 5 minutos? c) Cuntas personas requirieron al menos 4 minutos? d) Cul es la duracin que ocurre con mayor frecuencia? 3) Construya la tabla de frecuencia para una muestra aleatoria con datos del costo por consumo de electricidad en una zona residencial de cierta ciudad. 96 171 202 178 147 102 153 1297 127 82 157 185 90 116 172 111 148 213 130 165 141 149 206 175 123 128 144 168 109 167 95 163 150 154 130 143 187 166 139 149 108 119 183 151 114 135 191 137 129 158

13

Ing. Luis Rodrguez Ojeda, MSc

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Construccin de la tabla de frecuencias Vector con los datos >> x=[3.1 4.9 2.8 3.6 4.5 3.5 2.8 4.1 2.9 2.1 3.7 4.1 2.7 4.2 3.5 3.7 3.8 2.2 4.4 2.9... 5.1 1.8 2.5 6.2 2.5 3.6 5.6 4.8 3.6 6.1 5.1 3.9 4.3 5.7 4.7 4.6 5.1 4.9 4.2 3.1]; >> m=[1.5 2.5 3.5 4.5 5.5 6.5]; >> f=hist(x,m) f= 1 9 11 >> fr=f/40 fr = 0.0250 Vector con las marcas de clase Obtencin de las frecuencias en las marcas de clase 12 5 2 Frecuencias relativas 0.2250 0.2750 0.3000 0.1250 0.0500 Frecuencias acumuladas 33 38 40 Frecuencias acumuladas relativas 0.2500 0.5250 0.8250 0.9500 1.0000

>> F=cumsum(f) F= 1 10 21 >> Fr=F/40 Fr = 0.0250

14

Ing. Luis Rodrguez Ojeda, MSc

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2.4

REPRESENTACIN GRFICA DE CONJUNTOS DE DATOS

En esta seccin revisamos algunos dispositivos frecuentemente usados para resaltar visualmente las caractersticas de grupos de datos.

2.4.1 HISTOGRAMA
Es la manera ms comn de representar grficamente la distribucin de frecuencia de los datos. Se lo construye dibujando rectngulos cuya base corresponde a cada intervalo de clase, y su altura segn el valor de la frecuencia. Puede ser la frecuencia absoluta o la frecuencia relativa.

Ejemplo. Construya el histograma para el ejemplo de la unidad anterior. Use los valores de la frecuencia absoluta : Tabla de Frecuencia Frecuencia Marca Frecuencia Frecuencia Clase Intervalo Frecuencia relativa de clase relativa acumulada acumulada 1 [1, 2) 1.5 1 0.025 1 0.025 2 [2, 3) 2.5 9 0.225 10 0.250 3 [3, 4) 3.5 11 0.275 21 0.525 4 [4, 5) 4.5 12 0.300 33 0.825 5 [5, 6) 5.5 5 0.125 38 0.950 6 [6, 7) 6.5 2 0.050 40 1.000

Histograma

El histograma permite dar una primera mirada al tipo de distribucin de los datos: 1) Si las alturas de las barras son similares se dice que tiene distribucin tipo uniforme 2) Si las alturas son mayores en la zona central se dice que tiene forma tipo campana y puede ser simtrica o asimtrica, con sesgo hacia el lado positivo o al lado negativo 3) Si hay barras muy alejadas del grupo, se dice que son datos atpicos. Probablemente estos datos se deben a errores de medicin y se los puede descartar pues no pertenecen al grupo que se desea caracterizar.

15

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2.4.2 POLGONO DE FRECUENCIA


Es una manera de representar el perfil de la distribucin de los datos. Se obtiene uniendo mediante segmentos de recta los puntos (marca de clase, frecuencia) Para cerrar el polgono se puede agregar un punto a cada lado con frecuencia 0.

Polgono de frecuencia para el ejemplo dado:

2.4.3 OJIVA
Este grfico se usa para representar la frecuencia acumulada, absoluta o relativa. Se lo obtiene uniendo segmentos de recta que se extienden entre los extremos de las clases y usando los valores de la frecuencia acumulada.

Ojiva para el ejemplo dado:

La ojiva permite responder preguntas tipo cuantos datos son menores que

Ejemplo. Cuantos datos tienen un valor menor a 4.5? Respuesta: aproximadamente 27 datos

16

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2.4.4 GRFICOS DE FRECUENCIA CON FORMAS ESPECIALES


Los grficos pueden tomar otros aspectos usando barras, colores, efectos tridimensionales, sombreado, etc. o usando una representacin tipo pastel Diagrama de barras

Diagrama de barras con efecto tridimensional

Diagrama tipo pastel

17

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
Se tiene una muestra aleatoria con datos del costo por consumo de electricidad en una zona residencial de cierta ciudad. 96 157 141 95 108 171 185 149 163 119 202 90 206 150 183 178 116 175 154 151 147 172 123 130 114 102 111 128 143 135 153 148 144 187 191 1297 213 168 166 137 127 130 109 139 129 82 165 167 149 158

Use los resultados de la tabla de frecuencia y dibuje a mano los siguientes grficos. a) Histograma con las frecuencias relativas b) Polgono de Frecuencias c) Ojiva

MATLAB
Obtencin de grficos. Los dibujos obtenidos se muestran en las pginas anteriores Vector con los datos >> x = [3.1 4.9 2.8 3.6 4.5 3.5 2.8 4.1 2.9 2.1 3.7 4.1 2.7 4.2 3.5 3.7 3.8 2.2 4.4 2.9... 5.1 1.8 2.5 6.2 2.5 3.6 5.6 4.8 3.6 6.1 5.1 3.9 4.3 5.7 4.7 4.6 5.1 4.9 4.2 3.1]; Vector con las marcas de clase >> m=[1.5 2.5 3.5 4.5 5.5 6.5]; Graficacin del histograma >> hist(x, m); >> grid on

Cuadrculas

Graficacin del polgono de frecuencias >> mp=[0.5 m 7.5]; Se agrega un punto con frecuencia cero a los lados >> f = hist(x, m); Obtencin de las frecuencias en la m marcas de clase >> fp=[0 f 0]; >> clf >> plot(mp,fp,'o') >> hold on >> plot(mp,fp) >> grid on Graficacin de la ojiva >> c=[1 2 3 4 5 6 7]; >> F=cumsum(f); >> Fo=[0 F]; >> clf >> plot(c,Fo,'o')

Dibujo de los puntos en un nuevo grfico Mantener el grfico anterior Trazado de las lneas del polgono Cuadrculas

Vector con los extremos de las seis clases Vector con las frecuencias acumuladas Se agrega un punto a la izquierda con frecuencia cero

Dibujo de los puntos en un nuevo grfico

18

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

>> hold on >> plot(c, Fo) >> grid on

Para superponer el siguiente grfico Trazado de las lneas de la ojiva

Grfico de diagrama de barras con color verde >> clf >> bar(f,g) Grfico de diagrama de barras, horizontal con efecto tridimensional, color rojo >> clf >> bar3h(f,r) Grfico tipo pastel >> clf >> f=hist(x,m); >> pie(f)

19

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MEDIDAS DESCRIPTIVAS 2.5 MEDIDAS DE TENDENCIA CENTRAL


Son nmeros que definen cual es el valor alrededor del que se concentran los datos u observaciones. Se indican a continuacin los ms utilizados.

2.5.1 MEDIA MUESTRAL


Si X1, X2, ... , Xn representan a los datos, entonces se tiene: Definicin: Media muestral

X=

x1 + x 2 + ... + xn 1 n = xi n n i =1

Ejemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5 Entonces X = (2+6+11+8+11+4+7+5)/8 = 6.75

La media muestral es simple y de uso comn. Representa el promedio aritmtico de los datos. Sin embargo, es sensible a errores en los datos. Un dato errneo puede cambiar significativamente el valor de la media muestral. Para evitar este problema, se puede ignorar un pequeo porcentaje de los datos ms grandes y ms pequeos de la muestra antes de calcular la media muestral Ejemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5, 90 Entonces X = (2+6+11+8+11+4+7+5 + 90)/9 = 16 Un slo dato cambi significativamente el valor de la media con respecto al ejemplo anterior

2.5.2 MODA MUESTRAL


Es el valor que ocurre con mayor frecuencia en una muestra. Puede ser que no exista la moda y tambin es posible que exista ms de una moda. Definicin: Moda muestral Moda muestral: Mo es el valor que ms veces se repite

Ejemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5 Entonces Mo = 11

2.5.3 MEDIANA MUESTRAL


Es el valor que est en el centro de los datos ordenados Sean X1, X2, ... , Xn los datos los datos ordenados en forma creciente X(1), X(2), ... , X(n) El subndice entre parntesis significa que el dato X(i) est en la posicin i en el grupo ordenado.

20

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Definicin: Mediana muestral


si n es impar X n+ 1 , ( ) 2 ~ x= 1 (X n + X n ), si n es par ( + 1) 2 2 (2)

Ejemplo: Si los datos son 2, 6, 11, 8, 11, 4, 7, 5 Los datos ordenados: 2, 4, 5, 6, 7, 8, 11, 11, entonces

~ x=

1 (6 + 7) = 6.5 2

Las medidas de tendencia central no son suficientes para describir de manera precisa el comportamiento de los datos de una muestra. Se necesitan otras medidas.

2.6

MEDIDAS DE DISPERSIN

Son nmeros que proveen informacin adicional acerca del comportamiento de los datos, describiendo numricamente su dispersin.

2.6.1 RANGO
Es la diferencia entre el mayor valor y el menor valor de los datos de la muestra. Definicin: Rango R = X(n) X(1), en donde x(i) es el dato ordenado ubicado en la posicin i

Ejemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5 Entonces el rango es: R = 11 - 2 = 9

2.6.2 VARIANZA MUESTRAL


Esta medida se basa en la cuantificacin de las distancias de los datos con respecto al valor de la media Definicin: Varianza muestral

S =
2

(X
i =1
n

X)2
Frmula para calcular la varianza
n

n1
n Xi2 ( Xi )2
i=1 i=1

S2 =

n(n 1)

Frmula alterna para calcular la varianza

El motivo que en el denominador se escriba n 1 en lugar de n (que parece natural), se justifica formalmente en el estudio de la estadstica inferencial. Ambas frmulas son equivalentes y se lo puede demostrar mediante desarrollo de las sumatorias

21

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5 y se tiene que X = 6.75


Entonces la varianza es (2 6.75)2 + (6 6.75)2 + ... + (5 6.75)2 S2 = = 10.2143 7

2.6.3 DESVIACIN ESTNDAR MUESTRAL


Es la raz cuadrada positiva de la variancia. La desviacin estndar muestral o desviacin tpica o error muestral, est expresada en las misma unidad de medicin que los datos de la muestra

Definicin: Desviacin estndar muestral

S = + S2

Ejemplo. Calcule la desviacin estndar para el ejemplo anterior.


Si la varianza es S2 = 10.2143, entonces, la desviacin estndar es

S = S2 = 10.2143 = 3.196

2.7

MEDIDAS DE POSICIN

Son nmeros que dividen al grupo de datos ordenados, en grupos de aproximadamente igual cantidad de datos con el propsito de resaltar su ubicacin.

2.7.1 CUARTILES
Son nmeros que dividen al grupo de datos en grupos de aproximadamente el 25% de los datos

Primer Cuartil (Q1) A la izquierda de Q1 estn incluidos 25% de los datos (aproximadamente) A la derecha de Q1 estn el 75% de los datos (aproximadamente) Segundo Cuartil (Q2) Igual que la mediana divide al grupo de datos en dos partes, cada una con el 50% de los datos (aproximadamente) Tercer Cuartil (Q3) A la izquierda de Q3 estn incluidos 75% de los datos (aproximadamente) A la derecha de Q3 estn el 25% de los datos (aproximadamente) Ejemplo. Suponer que una muestra contiene 40 datos ordenados: X(1), X(2), ... , X(40). Calcular Q1, Q2, Q3 Q1: Por lo tanto: Q2: Q3:
25% de 40 = 10 Q1 = (X(10) + X(11))/2 50% de 40 = 20 Q2 = (X(20) + X(21))/2 75% de 40 = 30 Q3 = (X(30) + X(31))/2 es igual a la mediana

22

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2.7.2 DECILES
Son nmeros que dividen al grupo de datos en grupos de aproximadamente 10% de los datos

Primer Decil (D1) A la izquierda de D1 estn incluidos 10% de los datos (aproximadamente) A la derecha de D1 estn el 90% de los datos (aproximadamente) Segundo Decil (D2) A la izquierda de D2 estn incluidos 20% de los datos (aproximadamente) A la derecha de D2 estn el 80% de los datos (aproximadamente) Etc. Ejemplo. Suponer que una muestra contiene 40 datos ordenados: X(1), X(2), ... , X(40). Calcular D1 D1: Por lo tanto:
10% de 40 = 4 D1 = (X(4) + X(5))/2

2.7.3 PERCENTILES (O PORCENTILES)


Son nmeros que dividen al grupo de datos en grupos de aproximadamente 1% de los datos

Primer Percentil (P1) A la izquierda de P1 estn incluidos 1% de los datos (aproximadamente) A la derecha de P1 estn el 99% de los datos (aproximadamente) Segundo Percentil (P2) A la izquierda de P2 estn incluidos 2% de los datos (aproximadamente) A la derecha de P2 estn el 98% de los datos (aproximadamente) Etc. Ejemplo. Suponer que una muestra contiene 400 datos ordenados: X(1), X(2), ... , X(400). Calcular P1, P82 P1: Por lo tanto: P82:
1% de 400 = 4 P1 = (X(4) + X(5))/2 82% de 400 = 328 P82 = (X(328) + X(329))/2 (Percentil 1) (Percentil 82)

2.8

COEFICIENTE DE VARIACIN

Es un nmero que se usa para cara comparar la variabilidad de los datos de diferentes grupos. Es una medida adimensional definida de la siguiente manera

Definicin: Coeficiente de variacin S V= X

Ejemplo: Para un grupo de datos X = 20, S = 4, entonces v = 4/20 = 0.2 = 20% Para un segundo grupo X = 48, S = 6, entonces v = 6/48 = 0.125 = 12.5%
Se concluye que el primer grupo tiene mayor variabilidad (respecto a su media)

23

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
n xi n n i =1 2 2 1) Demuestre mediante propiedades de las sumatoria que (xi x) = xi n i=1 i=1 Esto demuestra la equivalencia entre las dos frmulas definidas para calcular la varianza.
2

2) Se tiene una muestra aleatoria con datos del costo por consumo de electricidad en una zona residencial de cierta ciudad.
96 157 141 95 108 Calcule X , 171 185 149 163 119 202 90 206 150 183 178 116 175 154 151 147 172 123 130 114

~ x , S2 , S,

Q1, Q3, R, D1, D5

3) Se tienen los siguientes datos de la cantidad de barriles por da que producen 45 pozos petroleros en un campo: cantidad mnima: 52; cantidad mxima 247; primer cuartil 87; mediana 163; tercer cuartil 204. Grafique la Ojiva con la mayor precisin que le sea posible. 4) Respecto al problema anterior. Una compaa est interesada en comprar solamente los pozos que produzcan mas de 100 barriles por da y pagar $150000 por cada uno. Cuanto le costara la inversin aproximadamente?

MATLAB
Frmulas para estadstica descriptiva >> x=[2 6 11 8 11 4 7 5]; >> xb=mean(x) xb = 6.7500 >> m=median(x) m= 6.5000 >> x=0:1:100; >> xb=mean(x) xb = 50 >> x=[x 1000]; >> xb=mean(x) xb = 59.3137 >> xb=trimmean(x,10) xb = 50.5000 >> x=[2 6 11 8 11 4 7 5]; >> r=range(x) r= 9
Vector con los datos de una muestra Media aritmtica

Mediana

Vector con los primeros 100 nmeros naturales Media aritmtica

Vector con un valor grande agregado al final Media aritmtica

Media aritmtica omitiendo 5% de datos en cada lado

Vector con los datos de una muestra Rango de los datos

24

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

>> a=min(x) a= 2 >> b=max(x) b= 11 >> s2=var(x) s2 = 10.2143 >> s=std(x) s= 3.1960 >> rq=iqr(x) rq = 5 >> q1=prctile(x,25) q1 = 4.5000 >> q3=prctile(x,75) q3 = 9.5000 >> y=sort(x) y= 2 4 5 6 >> x=rand(1,400); >> d7=prctile(x,70) d7 = 0.7013 >> p82=prctile(x,82) p82 = 0.8335

El menor valor

El mayor valor

Varianza muestral

Desviacin estndar muestral

Rango intercuartil

Primer cuartil (percentil 25)

Tercer cuartil (percentil 75)

Datos ordenados en forma creciente

11

11
Vector con una fila de 400 nmeros aleatorios Decil 7 (percentil 70)

Percentil 82

25

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2.9

FRMULAS PARA DATOS AGRUPADOS

Si los datos de una muestra estn disponibles en una tabla de frecuencia, se pueden usar frmulas para calcular las medidas estadsticas descriptivas, en forma aproximada Suponer que se dispone de la tabla de frecuencia con valores que se indican en forma simblica: Clase 1 2 ... k Intervalo [L1, U1] [L2, U2] ... [Lk, Uk] Marca m1 m2 ... mk f f1 f2 ... fk F F1 F2 ... Fk f/n f1/n f2/n ... fk/n F/n F1/n F2/n ... Fk/n

Definicin: Media de datos agrupados 1 k X = mi fi n i=1 n nmero de datos k nmero de clases marca de la clase i (es el centro del intervalo de la clase) mi fi frecuencia de la clase i Definicin: Varianza de datos agrupados

n k mi fi

1 k fi (mi X)2 n 1 i=1 nmero de datos nmero de clases marca de la clase i (es el centro del intervalo de la clase) frecuencia de la clase i S2 =

Definicin: Mediana para datos agrupados n Fi 1 i X = Li + 2 A fi i intervalo en el que se encuentra la mediana Li Lmite inferior del intervalo i n Nmero de observaciones Fi-1 Frecuencia acumulada del intervalo anterior al intervalo i fi frecuencia del intervalo i A Amplitud de la clase

Definicin: Moda para datos agrupados


fa A fa + fs i intervalo en el que se encuentra la moda Li Lmite inferior del intervalo i fa Exceso de la frecuencia sobre la clase inferior inmediata Exceso de la frecuencia sobre la clase superior inmediata fs A Amplitud de la clase Mo no es un dato real pero se supone que sera el dato ms frecuente Mo = Li +

26

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Definicin: Medidas de posicin para datos agrupados


n j( ) Fi 1 Q j = Li + 4 A , j = 1, 2, 3 cuartiles fi intervalo en el que se encuentra el primer cuartil Lmite inferior del intervalo i Nmero de observaciones Frecuencia acumulada del intervalo anterior al intervalo i frecuencia del intervalo i Amplitud de la clase

i Li n Fi-1 fi A

Ejemplo: La tabla de frecuencia siguiente contiene los datos del nmero de artculos vendidos por un almacn en 50 das, agrupados en 6 clases Clase 1 2 3 4 5 6 Intervalo [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) [60, 70) Marca 15 25 35 45 55 65 f 2 10 12 14 9 3 F 2 12 24 38 47 50 f/n 0.04 0.2 0.24 0.28 0.18 0.06 F/n 0.04 0.24 0.48 0.76 0.94 1

Calcule la media, varianza, mediana, moda y los cuartiles

Media

X=
Varianza

1 k 1 mi fi = [(15)(2) + (25)(10) + ... + (65)(3)] = 40.4 n i=1 50

S2 =

1 k fi (mi X)2 n 1 i=1 1 [2(15 40.4)2 + 10(25 40.4)2 + ... + 3(65 40.4)2 ] = 164.12 = 49

Mediana Para usar la frmula debe localizarse la clase en la cual est la mediana Siendo n = 50, la mediana es el promedio entre los datos X(25), X(26) Estos datos se encuentran en la clase 4, por lo tanto n 50 24 F3 2 i 10 = 40.71 X = L4 + A = 40 + 2 f4 14

Moda El intervalo en el que se considera que se encuentra la moda corresponde a la clase con mayor frecuencia, En el ejemplo, sera la clase 4 fa 2 Mo = L 4 + A = 40 + 10 = 42.85 (es una valor supuesto para la moda) fa + fs 2+5

27

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Primer Cuartil Q1 corresponde a la observacin X(13). Este dato se encuentra en la clase 3, por lo tanto 50 n 1( ) F2 1( ) 12 4 Q1 = L3 + A = 30 + 4 10 = 30.41 f3 12 Para comparar, anotamos los datos originales de los cuales se obtuvo la tabla de frecuencia:
37 32 49 23 36 48 47 26 38 45 48 50 20 43 43 57 46 63 43 12 32 28 20 45 21 63 19 41 54 55 55 29 35 58 50 34 33 38 53 27 48 53 35 49 24 36 68 25 32 42

Los mismos datos pero ordenados en forma creciente 12 19 20 20 21 23 24 25 28 29 32 32 32 33 34 35 36 37 38 38 41 42 43 43 45 46 47 48 48 48 49 49 53 53 54 55 55 57 58 63

26 35 43 50 63

27 36 45 50 68

Con los cuales se obtuvieron directamente los siguientes resultados X = 40.16 S2 = 169.81 i X = 41.5 Q1 = 32 Mo = 32, 43, 48 (trimodal)

Ejemplo. Se dispone de los siguientes datos incompletos en una tabla de frecuencia Clase 1 2 3 4 5 6 7 Intervalo [1, 2) Marca f 1 F 6 0.25 8 0.05 0.7 0.9 f/n F/n

Completar la tabla de frecuencia Solucin


Se escriben directamente los intervalos, marcas de clase y algunos valores de frecuencia

Clase 1 2 3 4 5 6 7

Intervalo [1, 2) [2, 3) [3, 4) [4, 5) [5, 6) [6, 7) [7, 8)

Marca 1.5 2.5 3.5 4.5 5.5 6.5 7.5

f 1 5

F 1 6

f/n

F/n

0.25 8
0.2 0.05 0.05

0.7 0.9 0.95 1

28

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Para continuar usamos la siguiente relacin contenida en la tabla: 8/n = 0.2 De donde se obtiene que n = 40. Conocido el valor de n, se puede continuar desde arriba

Clase 1 2 3 4 5 6 7

Intervalo [1, 2) [2, 3) [3, 4) [4, 5) [5, 6) [6, 7) [7, 8)

Marca 1.5 2.5 3.5 4.5 5.5 6.5 7.5

f 1 5

F 1 6

f/n 0.025 0.125 0.25 0.3 0.2 0.05 0.05

F/n 0.025 0.15 0.40 0.7 0.9 0.95 1

Finalmente, con la definicin de frecuencia relativa se puede completar la tabla

Clase 1 2 3 4 5 6 7

Intervalo [1, 2) [2, 3) [3, 4) [4, 5) [5, 6) [6, 7) [7, 8)

Marca 1.5 2.5 3.5 4.5 5.5 6.5 7.5

f 1 5 10 12 8 2 2

F 1 6 16 28 36 38 40

f/n 0.025 0.125 0.25 0.3 0.2 0.05 0.05

F/n 0.025 0.15 0.40 0.7 0.9 0.95 1

Calcular la media, varianza, mediana, moda y el primer cuartil


Con las frmulas correspondientes se pueden calcular las medidas descriptivas indicadas igual que en el ejercicio anterior

EJERCICIOS
Se dispone de los siguientes datos incompletos en una tabla de frecuencia

Clase 1 2 3 4 5 6 7

Intervalo

Marca

F 2

f/n

F/n 0.25 0.6

[15, 20)

14 36

0.975

Se conoce adems que la media calculada con los datos agrupados es 19.7

a) Complete la tabla de frecuencia b) Calcule la media, varianza, mediana, moda y el tercer cuartil Sugerencia: Al colocar los datos en la tabla quedarn dos incgnitas en la columna f. Con la frmula del dato adicional dado X se obtiene otra ecuacin con las mismas incgnitas. Estas dos ecuaciones son lineales y luego de resolverlas se puede continuar llenando la tabla.

29

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2.10 INSTRUMENTOS GRFICOS ADICIONALES


2.10.1 DIAGRAMA DE CAJA
Es un dispositivo grfico que se usa para expresar en forma resumida, algunas medidas estadsticas de posicin:

El diagrama de caja describe grficamente el rango de los datos, el rango intercuartlico (Q3 Q1) los valores extremos y la ubicacin de los cuartiles. Es una representacin til para comparar grupos de datos. Por ejemplo se resalta el hecho que el 50% de los datos est en la regin central entre los valores de los cuartiles Q1 y Q3

2.10.2 DIAGRAMA DE PUNTOS


Si la cantidad de datos es pequea, (alrededor de 20 o menos), se los puede representar mediante puntos directamente sin resumirlos en intervalos.

2.10.3 DIAGRAMA DE PARETO


Es un grfico til para identificar los efectos importantes de un proceso y las causas que los originan. La Ley de Pareto dice que de cualquier conjunto de eventos que pueden asociarse a un suceso, solamente unos pocos contribuyen en forma significativa mientras que los dems son secundarios. Generalmente hay nicamente 2 o 3 causas que explican mas de la mitad de las ocurrencias del suceso. Procedimiento para construir el diagrama de Pareto 1) Categorice los datos por tipo de problema 2) Determine la frecuencia y ordene en forma decreciente 3) Represente la frecuencia relativa con barras 4) Superponga la ojiva de la frecuencia relativa acumulada 5) Determine cuales son las causas mas importantes que inciden en el suceso de inters

Ejemplo Un fabricante ha realizado un conteo de los tipos de defectos de sus productos y ha registrado su frecuencia. Los resultados se resumen en el siguiente cuadro Tipo de Defecto Frecuencia Frecuencia relativa (%) 0.33 0.22 0.17 0.10 0.07 0.06 0.05 Frecuencia acumulada 66 110 144 164 178 190 200 Frecuencia acumulada relativa (%) 0.33 0.55 0.72 0.82 0.89 0.95 1.00

A B C D E F G

66 44 34 20 14 12 10

Representar los datos con un Diagrama de Pareto

30

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Diagrama de Pareto Se puede observar que ms del 70% de los defectos de produccin corresponden a los tipos A, B y C. Con esta informacin, una decisin adecuada sera asignar recursos para solucionar estos tipos de problemas pues son los que ocurren con mayor frecuencia.

2.10.4 DIAGRAMA DE TALLO Y HOJAS


Es un dispositivo utilizado cuando la cantidad de datos es pequea. Permite describir la distribucin de frecuencia de los datos agrupados pero sin perder la informacin individual de los datos. La longitud de cada fila ayuda a visualizar la frecuencia, en forma parecida a un histograma pero al mismo tiempo se pueden observar individualmente los datos. Se construye escribiendo verticalmente las primera(s) cifra(s) de los datos (tallo) y escribiendo las restantes cifras horizontalmente (hojas)

Ejemplo. Los siguientes datos corresponden a la cantidad de artculos defectuosos producidos en una fbrica en 20 das: 65, 36, 59, 84, 79, 56, 28, 43, 67, 36, 43, 78, 37, 40, 68, 72, 55, 62, 22, 82 Dibuje el diagrama de tallo y hojas Se elige la cifra de las decenas como tallo y la cifra de las unidades como las hojas: Tallo 2 3 4 5 6 7 8 Hojas 2 6 0 5 2 2 2

8 6 3 6 5 8 4

7 3 9 7 9

31

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) Dibuje un diagrama de caja para los siguientes datos 1.42 1.26 1.10 1.33 1.41 1.00 1.34 1.18 1.41 1.25 1.35 1.21 1.81 1.65 1.18 2) Dibuje un diagrama de Pareto con los siguientes datos 46 4 26 15 52 2 5 3) Realice un diagrama de tallo y hojas con los siguientes datos 8.3 4.5 9.5 1.4 8.6 7.6 4.4 6.2 9.5 6.4 2.4 3.5 1.8 4.9 4.0 4.6 6.1 8.7 3.1 6.0 1.7 6.2 2.4 5.8 5.0 4.6 5.4 9.4 3.4 4.0 3.0 4.1 2.8 3.9 5.0 7.2 3.0 1.1 4.4 4.6 7.1 6.6 7.2 2.8 2.6

MATLAB
Dibujar un diagrama de Pareto para los siguientes datos >> x = [66 44 34 20 14 12 10]; >> nombres = {'A' 'B' 'C' 'D' 'E' 'F','G'}; >> pareto(x, nombres) >> grid on Vector con los datos Nombres para los componentes en el diagrama Dibujar el diagrama de Pareto Agregar cuadrculas

El dibujo resultante se muestra en la pgina anterior

Dibujar un diagrama de caja >> x = [0.1 1.7 2.3 4.4 4.5 4.8 6.0 6.1 7.3 7.6 7.9 8.2 8.9 9.2 9.5]; >> boxplot(x) Vector con datos Diagrama de caja

32

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

>> boxplot(x, 1, '', 0)

Diagrama de caja horizontal, con muesca

33

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2.11 MUESTRAS BIVARIADAS


Es comn tener que estudiar muestras con datos que miden dos caractersticas, siendo de inters determinar si hay alguna relacin entre las dos variables. Para visualizar la relacin entre los datos de una muestra bivariada, es til graficarlos en una representacin que se denomina diagrama de dispersin.

Ejemplo Se tiene una muestra de las calificaciones de 10 estudiantes de los exmenes parcial y final. Examen Parcial Examen Final 60 72 74 82 66 75 34 46 60 73 66 74 57 70 71 82 39 60 57 61

Dibuje el diagrama de dispersin. Sean X: Calificacin del primer parcial (variable independiente) Y: Calificacin del examen final (variable dependiente)

Se observa que los datos estn relacionados con una tendencia lineal con pendiente positiva

34

Ing. Luis Rodrguez Ojeda, MSC.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2.11.1 CORRELACIN
Se usa el trmino correlacin para describir la relacin entre los datos de muestras bivariadas. Grficos para apreciar la correlacin entre dos variables

Ejemplo.- Se puede decir que los datos en el ejemplo anterior tienen correlacin lineal positiva

2.11.2 COEFICIENTE DE CORRELACION LINEAL


Es una definicin para cuantificar el grado de correlacin lineal entre las variables. Es una medida adimensional til para comparar variables con unidades de medida diferentes. Primero de establecen algunas definiciones impotantes Sean X, Y: n: X, Y : SX, SY: SXY: Definiciones Medias aritmticas muestrales 1 n 1 n X = Xi , Y = Yi n i=1 n i=1 Varianzas muestrales 1 n 1 n 2 2 = x) = S2 (x S , i (yi y)2 X Y n 1 i =1 n 1 i =1 Covarianza muestral 1 n SXY = (xi x)(yi y) n 1 i=1 Variables muestrales Tamao de la muestra Media aritmtica de X, Y, respectivamente Desviaciones estndar muestrales Covarianza muestral

35

Ing. Luis Rodrguez Ojeda, MSC.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Definicin: Coeficiente de correlacin lineal


r= SXY , -1 r 1 SX SY

Si r est cercano a 1, entonces X y Y tienen correlacin lineal positiva fuerte Si r est cercano a -1, entonces X y Y tienen correlacin lineal negativa fuerte Si r est cercano a 0, entonces X y Y no estn correlacionadas linealmente, o es muy dbil Es importante que se mida la correlacin entre variables cuya asociacin tenga algn sentido Asmismo, si las variables no estn correlacionadas linealmente, pudiera ser que si lo estn mediante una relacin no lineal

2.11.3 MATRIZ DE VARIANZAS Y COVARIANZAS


Es una representacin ordenada de las varianzas y las covarianzas entre las variables Si se usa la notacin X1 = X, SX1 = SX

X2 = Y,

SX2 = SY

Definicin: Matriz de varianzas y covarianzas

S2 S X X = X1 i j S X 2 X1

SX1X2 2 S X2

Es una matriz simtrica

2.11.4 MATRIZ DE CORRELACION


Es una representacin ordenada de los coeficientes de correlacin de cada variable con la otra variable y consigo misma. Si se usa la notacin X1 = X, SX1 = SX

X2 = Y,

SX2 = SY
coeficiente de correlacin lineal entre Xi y Xj

rij =

S Xi X j S Xi S X j

Definicin: Matriz de correlacin

r r rij = 1,1 1,2 r2,1 r2,2


Es una matriz simtrica. Los valores en la diagonal principal son iguales a 1 Las definiciones de matriz de varianzas-covarianzas y matriz de correlacin, pueden extenderse directamente a ms variables

36

Ing. Luis Rodrguez Ojeda, MSC.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo Se tienen una muestra de las calificaciones de 10 estudiantes del primer parcial y del segundo parcial. Primer 60 74 66 34 60 66 57 71 39 57 Parcial Segundo 72 82 75 46 73 74 70 82 60 61 Parcial Encuentre el coeficiente de correlacin lineal e interprete el resultado Solucin Sean: X: Calificacin del primer parcial Y: Calificacin del segundo parcial

1 n 1 xi = 10 (60 + 74 + 66 + 34 + 60 + 66 + 57 + 71 + 39 + 57) = 58.4 n i=1 1 n 1 s2 (xi x)2 = 9[(60 58.4)2 + (74 58.4)2 + ... + (57 58.4)2 ] = 166.4889 X = n 1 i=1 x=

s x = s2 166.4889 = 12.9031 X =
y= 1 n 1 yi = (72 + 82 + 75 + 46 + 73 + 74 + 70 + 82 + 60 + 61) = 69.5 n i=1 10 1 n 1 s2 (yi y)2 = 9[(72 69.5)2 + (82 69.5)2 + ... + (61 69.5)2 ] = 121.8333 Y = n 1 i=1

s Y = s2 121.8333 = 11.0378 Y =
SXY = 1 n (xi x)(yi y) n 1 i=1 1 = [(60 58.4)(72 69.5) + (74 58.4)(82 69.5) + ... 9 + (57 58.4)(61 69.5)] = 134.1111

Coeficiente de correlacin S 134.1111 r = XY = = 0.9416 SX SY (12.9031)(11.0378) El resultado indica que la correlacin es fuertemente positiva

Escriba las matrices de varianzas-covarianzas y de correlacin. Sean

X1 = X, X2 = Y,

S X1 = S X SX2 = SY

Matriz de varianzas-covarianzas

S2 S X X = X1 i j S X 2 X1

SX1X2 166.4889 134.1111 = 2 SX2 134.1111 121.8333

37

Ing. Luis Rodrguez Ojeda, MSC.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Matriz de correlacin
Con la definicin: rij

S Xi X j S Xi S X j

, sustituyendo los valores respectivos se obtiene

r 1 0.9416 r rij = 1,1 1,2 = 1 r2,1 r2,2 0.9416

EJERCICIOS
Los siguientes datos representan el tiempo, en horas, de entrenamiento de los trabajadores de una empresa, y el teimpo que tardaron, en minutos, en realizar la actividad encomendada Examen Parcial Examen Final

10 9

5 12

12 8

8 10

6 13

8 11

4 12

10 8

a) Dibuje el diagrama de dispersin e indique que tipo de correlacin parecen tener las variables X y Y b) Escriba la matriz de varianzas y covarianzas c) Escriba la matriz de correlacin d) Calcule el coeficiente de correlacin e interprete el resultado

38

Ing. Luis Rodrguez Ojeda, MSC.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Vectores con datos de dos variables >> x=[60 74 66 34 60 66 57 71 39 57]; >> y=[72 82 75 46 73 74 70 82 60 61]; Diagrama de dispersin. El grfico aparece en la primera pgina de esta seccin >> scatter(x,y,'k') >> grid on Matriz de varianzas y covarianzas >> v=cov(x,y) v= 166.4889 134.1111 134.1111 121.8333 Matriz de correlacin >> r=corrcoef(x,y) r= 1.0000 0.9416 0.9416 1.0000 Varianza, covarianza y coeficiente de correlacin: >> vx = v(1,1) vx = 166.4889 >> vy = v(2,2) vy = 121.8333 >> vxy = v(2,1) vxy = 134.1111 >> rxy = r(2,1) rxy = 0.9416 >> v=diag(cov(x,y)) v= 166.4889 121.8333 >> s=sqrt(diag(cov(x,y))) s= 12.9031 11.0378
Varianza de X

Varianza de Y

Covarianza de X, Y

Coeficiente de correlacin de X, Y

Vector con las varianzas (es la diagonal de la matriz)

Vector con las desviaciones estndar

39

Ing. Luis Rodrguez Ojeda, MSC.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

FUNDAMENTOS DE LA TEORA DE LA PROBABILIDAD

En esta unidad se escriben algunas definiciones necesarias para fundamentar el estudio de la teora de la probabilidad.

3.1

EXPERIMENTO ESTADSTICO

Es un procedimiento que se realiza con el propsito de obtener observaciones para algn estudio de inters. Un experimento requiere realizar pruebas o ensayos para obtener resultados. Un experimento estadstico tiene las siguientes caractersticas 1. Se conocen todos los resultados posibles antes de realizar el experimento estadstico. 2. No se puede predecir el resultado de cada ensayo realizado (propiedad de aleatoriedad) 3. Debe poderse reproducir o repetir el experimento en condiciones similares. 4. Se puede establecer un patrn predecible a lo largo de muchas ejecuciones del experimento. Esta propiedad se denomina regularidad estadstica. Ejemplos 1) Lanzar un dado y observar el resultado obtenido. 2) Medir la altura de una persona 3) Observar el tipo de defecto de un artculo producido por una fbrica

3.2

ESPACIO MUESTRAL

El espacio muestral, representado con la letra S, es el conjunto de todos los resultados posibles de un experimento. Cada elemento de S se denomina punto muestral. Segn la naturaleza del experimento, los puntos muestrales pueden determinar que S sea discreto o continuo. S es discreto si sus elementos pueden ponerse en correspondencia con los nmeros naturales. En este caso S puede se finito o infinito. S es continuo si los resultados corresponden a algn intervalo de los nmeros reales. En este caso S es infinito por definicin. Ejemplos Experimento: Espacio muestral: Propiedades de S: Experimento: Espacio muestral: Propiedades de S: Experimento: Espacio muestral: Propiedades de S: Experimento: Espacio muestral: Propiedades de S:

Lanzar un dado y observar el resultado S={1, 2, 3, 4, 5, 6] discreto y finito Elegir al azar dos artculos de un lote y observar la cantidad de artculos defectuosos S={0, 1, 2} discreto y finito Lanzar un dado y contar la cantidad de intentos hasta obtener como resultado el 6 S={1, 2, 3, . . .} discreto e infinito Medir el peso en gramos de un artculo elegido al azar S={x | x>0, xR} continuo (infinito por definicin)

40

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

3.3

EVENTOS

Un evento es algn subconjunto del espacio muestral S. Se usan letras maysculas para denotar eventos. Ejemplo: Experimento: Lanzar un dado y observar el resultado Espacio muestral: S = {1, 2, 3, 4, 5, 6] Sea el evento de inters: A: el resultado es un nmero par Entonces: A = {2, 4, 6}

Definiciones Evento nulo: No contiene resultados Evento simple: Contiene un solo resultado Eventos excluyentes: Eventos que no contienen resultados comunes

3.4

-ALGEBRA

El soporte matemtico natural para el estudio de las propiedades de los eventos es la Teora de Conjuntos. Pero existe un lgebra formal especfica para su estudio denominada -algebra (sigma lgebra).

-algebra A es una coleccin no vaca de subconjuntos de S tales que 1) SA 2) Si A A, entonces AC A


3)
Si A1, A2, ... A, entonces Ui = 1A i A

En resumen -algebra A incluye a S, a sus subconjuntos y es cerrada con respecto a la operacin de unin de conjuntos.

41

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

3.5

TCNICAS DE CONTEO

En esta seccin revisamos algunas frmulas bsicas para conteo de elementos de conjuntos con las cuales, en las siguientes unidades, se podr asignar valores de probabilidad a eventos. Defincin: Principio bsico del conteo Si un conjunto tiene n elementos y otro conjunto tiene m elementos, entonces existen nxm formas diferentes de tomar un elemento del primer conjunto y otro elemento del segundo conjunto.

Ejemplo: Para ir de su casa a la universidad un estudiante debe ir primero a una estacin intermedia de transferencia: Sean A: Casa del estudiante B: Estacin intermedia de transferencia C: Universidad Suponga que hay tres lneas de buses para ir de A a B y que desde B para llegar a C, puede usar el bus de la universidad o el carro de un amigo. De cuantas formas diferentes puede ir de su casa a la universidad? Respuesta. Sean 1, 2, 3 las lneas de buses de A a B, y 4, 5 las formas de ir de B a C. Representemos las diferentes opciones mediante un diagrama de rbol.

Para ir de A a B hay 3 formas diferentes y para ir de B a C, hay 2 formas diferentes. Por lo tanto, para ir de A a C hay 3x2 = 6, formas diferentes. El conjunto de resultados posibles para este experimento es: S = {(1, 4), (1, 5), (2, 4), (2, 5), (3, 4), (3, 5)}

Ejemplo. Cuantos nmeros de placas diferentes pueden existir en la provincia del Guayas? Respuesta. Cada nmero de placa tiene la siguiente estructura: G (letra) (letra) (dgito) (dgito) (dgito) Hay 26 letras diferentes (sin incluir ) y 10 dgitos diferentes. Si no importa repetir letras o dgitos en cada placa, el total es: 26 x 26 x 10 x 10 x 10 = 676000

42

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. Un grupo de 10 personas debe elegir a su directiva; presidente, secretario, tesorero. Todos pueden ser elegidos, pero una persona no puede tener ms de un cargo. De cuantas maneras diferentes puede realizarse la eleccin? Respuesta Para elegir presidente hay 10 formas diferentes Para elegir secretario quedan 9 formas diferentes Para elegir tesorero quedan 8 formas diferentes Por el principio bsico del conteo, hay 10 x 9 x 8 = 720 formas diferentes de realizar la eleccin.

EJERCICIOS
1) Un taller de mantenimiento tiene tres tcnicos: A, B, C. Cierto da, dos empresas X, Y requieren un tcnico cada una. Describa el conjunto de posibles asignaciones si cada tcnico puede ir solamente a una empresa. 2) En el ejercicio anterior, suponga que el mismo tcnico debe ir primero a la empresa X y luego a la empresa Y. Describa el conjunto de posibles asignaciones. 3) Hay tres paralelos para el curso de Clculo Diferencial y tres paralelos para Algebra Lineal. Un estudiante desea tomar ambos cursos. Escriba el conjunto de posibles asignaciones. 4) En un curso preuniversitario los exmenes solan contener 20 preguntas y cada una con cinco opciones. De cuantas formas diferentes se poda contestar el examen?

43

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

3.6

PERMUTACIONES

Son los arreglos diferentes que se pueden hacer con los elementos de un conjunto. En estos arreglos se debe considerar el orden de los elementos incluidos. Suponga un conjunto de n elementos diferentes, del cual se toma un arreglo de r elementos. Si se incluye un elemento en cada arreglo, la cantidad de arreglos diferentes que se obtiene es: n (Cualquiera de los n elementos puede ser elegido) Si se incluyen 2 elementos en cada arreglo, la cantidad de arreglos diferentes que se obtiene es n(n-1) (Para elegir el segundo elemento quedan n 1 disponibles) Si se incluyen 3 elementos en cada arreglo, la cantidad de arreglos diferentes que se obtiene es n(n-1)(n-2) (Para elegir el tercer elemento quedan n 2 disponibles) ... Si se incluyen r elementos en cada arreglo, la cantidad de arreglos diferentes que se obtiene es n(n-1)(n-2). . .(n-r+1) (Para elegir el elemento r quedan n r + 1 disponibles) Con eso se puede escribir la frmula general para la cantidad de permutaciones: Definicin: Nmero de permutaciones Nmero de permutaciones con n elementos de un conjunto del cual se toman arreglos conteniendo r elementos
nPr

= n(n-1)(n-2). . .(n-r+1)

Ejemplo. Un grupo de 10 personas debe elegir a su directiva; presidente, secretario, tesorero. Todos pueden ser elegidos, pero una persona no puede tener ms de un cargo. De cuantas maneras diferentes puede realizarse la eleccin?. Use la frmula (7.1) Respuesta. Los arreglos posiles son permutaciones pues el orden en cada uno si es de inters. Por lo tanto n =10, r =3, 10P3 = 10x9x8 = 720

La frmula de permutaciones se puede expresar en notacin factorial completando el producto: : Definicin: Frmula alterna para calcular el nmero de permutaciones
nPr

= n(n-1)(n-2). . .(n-r+1) =

n(n 1)(n 2)...(n r + 1)(n r)(n r 1)...(2)(1) n! = (n r)(n r 1)...(2)(1) (n r)!

44

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

CASOS ESPECIALES
3.6.1 PERMUTACIONES CON TODOS LOS ELEMENTOS
Definicin: Permutaciones con todos los elementos de un conjunto
nPn

n! n! = = n! , (n n)! 0!

n: Cantidad de elementos del conjunto

Ejemplo: Cuantos arreglos diferentes se pueden hacer colocando en una hilera 5 lpices de colores? Respuesta: Son permutaciones con todos los elementos:
5P5

= 5! = 120

3.6.2 ARREGLO CIRCULAR Suponga un grupo conteniendo n elementos diferentes. Un arreglo circular es una permutacin
con todos los elementos del grupo. Para que cada arreglo sea diferente, uno de los elementos debe mantenerse fijo y los otros pueden cambiar el orden. Definicin: Nmero de permutaciones en un arreglo circular Si n es el nmero total de elementos, la cantidad de arreglos diferentes es: (n-1)!

Ejemplo: De cuantas formas diferentes pueden colocarse 5 personas alrededor de una mesa? Respuesta: 4! = 24

3.6.3 PERMUTACIONES CON ELEMENTOS REPETIDOS Si del total de n elementos, n1 fuesen repetidos, entonces los arreglos tendran formas idnticas cuando se considera el orden de los n1 elementos repetidos. Existen n1! formas de tomar los n1 elementos repetidos, por lo tanto, la cantidad de permutaciones se reducira en n1!
Definicin: Cantidad de permutaciones con n elementos de los cuales n1 son repetidos

n! n1!
Este razonamiento, puede extenderse cuando hay ma grupos de elementos repetidos Sean: n: Cantidad total de elementos Cantidad de elementos repetidos de un tipo Cantidad de elementos repetidos de otro tipo Se debe cumplir que n1 + n2 = n

n1: n2:

45

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Definicin: Permutaciones con dos tipos de elementos repetidos

n elementos de los cuales n1 son de un tipo y n2 son de otro tipo n! n1! n2 !


Ejemplo: En una caja hay 3 botellas de vino tinto y 2 de vino blanco. Las botellas de cada uno de los dos tipos de vino tienen la misma marca y forma. De cuantas formas diferentes pueden colocarse en una hilera las 5 botellas? Respuesta: Son permutaciones con elementos repetidos con n=5, n1=3, n2=2,

5! = 10 2! 3!

La frmula se puede generalizar a ms grupos con elementos repetidos Definicin: Permutaciones con n elementos y k grupos con elementos repetidos Sean

n: total de elementos distribuidos en k grupos n1: Nmero de elementos repetidos de tipo 1 n2: Nmero de elementos repetidos de tipo 2
. .

nk: Nmero de elementos repetidos de tipo k


Siendo n1 + n2+ +nk = n Cantidad de arreglos diferentes que se pueden obtener

n! n1! n2 ! ... nk !
.

Ejemplo. Cuntos arreglos diferentes pueden hacerse con las letras de la palabra MATEMTICA? n=10. n1=2 (repeticiones de la letra M) n2=3 (repeticiones de la letra A) n3=2 (repeticiones de la letra T) las otras letras ocurren una sola vez Respuesta:
10! = 151200 2! 3! 2! 1! 1! 1!

46

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

3.7

COMBINACIONES

Son los arreglos que se pueden hacer con los elementos de un conjunto. El orden de los elementos en cada arreglo no es de inters. Cada arreglo se diferencia nicamente por los elementos que contiene. Sean n: Cantidad de elementos del conjunto r: Cantidad de elementos en cada arreglo Se usa la notacin nCr, o C r , o r para denotar la cantidad de combinaciones de tamao r que se pueden realizar con los n elementos distintos de un conjunto
n

Para obtener la frmula del nmero de combinaciones, consideremos la frmula de las permutaciones. Debido a que en las combinaciones no interesa el orden de los elementos en cada arreglo, es equivalente a tener permutaciones con elementos repetidos: Definicin: Nmero de combinaciones Conjunto con n elementos del cual se toman arreglos conteniendo r elementos n! n(n 1)(n 1)...(n r + 1) nP r = = nCr = r! (n r)! r ! r!

Ejemplo. Un bar dispone de 10 frutas diferentes de las cuales se pueden elegir tres para un batido. De cuantas maneras diferentes puede hacerse la eleccin? Respuesta: Son combinaciones pues el orden de las frutas no es de inters.

n=10, r=3,

10C3

10! = 120 7! 3!

Ejemplo. En un grupo de 15 personas, 7 leen la revista A, 5 leen la revista B y 6 ninguna revista. Encuentre la cantidad de personas que leen al menos una revista Respuesta. Para el clculo puede usarse una representacin grfica de conjuntos, pero una representacin tabular facilita hallar el nmero de elementos de cada evento. Primero se colocan en el cuadro los datos (color negro). y luego se completa el cuadro con los valores faltantes (color azul). Para los clculos se ha seguido el orden indicado en el dibujo.

47

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Del cuadro se obtiene directamente que 4 leen A, nicamente 2 leen B, nicamente 3 leen A y B Por lo tanto, 9 personas leen al menos una revista Cantidad de formas diferentes de elegir cuatro personas que al menos lean una revista Respuesta: 9C4 = 9! = 126 5! 4 ! Cantidad de formas diferentes de elegir 4 personas de tal manera que 2 solamente lean A, 1 solamente B, y 1 no lea revistas. Respuesta: Cantidad de formas diferentes de elegir 2 de las que solamente leen A: Cantidad de formas diferentes de elegir 1 de las que solamente leen B: Cantidad de formas diferentes de elegir 1 de las que no leen revistas: Por el principio bsico del conteo el resultado final es: 6 x 2 x 6 = 72
4C2 = 2C1 = 6C1 =

6 2 6

EJERCICIOS
1) Una caja contiene cinco libros de Matemticas y una segunda caja contiene 4 libros de Fsica. De cuantas maneras diferentes se puede tomar un libro para materia? a) si todos los libros son diferentes, b) si los libros de cada materia son iguales 2) Para un proyecto se requiere dos ingenieros y tres tcnicos. Si hay cuatro ingenieros y cinco tcnicos disponibles. De cuantas maneras se puede hacer la eleccin? 3) Una caja contiene 6 bateras de las cuales 2 son defectuosas. De cuantas maneras se pueden tomar tres bateras de tal manera que solamente haya una defectuosa? 4) En un grupo de 60 estudiantes, 42 estn registrados en Anlisis Numrico, 38 en Estadstica y 10 no estn registrados en ninguna de estas dos materias. Cuantos estn registrados nicamente en Estadstica? Cuantos estn registrados en Estadstica pero no en Anlisis Numrico? 5) El cable de seguridad de una bicicleta tiene un candado que contiene 4 discos. Cada disco tiene seis nmeros. Si probar cada combinacin toma cinco segundos, determine el tiempo mximo que le tomar a una persona encontrar la clave para quitar el cable de seguridad que sujeta a la bicicleta

48

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
>> c = nchoosek(9,4) c = 126 >> r = factorial(5) r = 120 >> x=[2 3 5 7]; >> lista=combnk(x,3) lista = 2 3 5 2 3 7 2 5 7 3 5 7 >> n=length(lista) n= 4 >> x=[3 5 7]; >> lista=perms(x) lista = 7 5 3 7 3 5 5 7 3 5 3 7 3 5 7 3 7 5 >> x = {'Juan', 'Pedro', 'Pablo'}; >> lista=combnk(x,2) lista = 'Juan' 'Pedro' 'Juan' 'Pablo' 'Pedro' 'Pablo' Clculo de 9C4 Factorial de 5 Conjunto de 4 elementos Lista de combinaciones de 3 elementos

Nmero de combinaciones Conjunto de tres elementos Lista de permutaciones

Conjunto con tres elementos Lista de combinaciones de 2 elementos

49

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

3.8

PROBABILIDAD DE EVENTOS

El valor de la probabilidad de un evento es una medida de la certeza de su realizacin Sea A un evento, entonces P(A) mide la probabilidad de que el evento A se realice P(A)=0 es la certeza de que no se realizar P(A)=1 es la certeza de que si se realizar P(A)=0.5 indica igual posibilidad de que se realice o no se realice. Asignacin de valores de probabilidad a eventos 1) Emprica Es la proporcin de veces que un evento tuvo el resultado esperado respecto al total de intentos realizados. Ejemplo. Se han realizado 20 ensayos en un experimento en condiciones similares. Cuatro ensayos tuvieron el resultado esperado. Entonces, la probabilidad que en el siguiente ensayo se obtenga el resultado esperado es aproximadamente: 4/20=0.2=20% 2) Mediante modelos matemticos Para muchas situaciones de inters puede definirse un modelo matemtico para determinar la probabilidad de eventos. Algunos de estos modelos son estudiados en este curso, tanto para variables discretas como continuas. 3) Asignacin clsica Su origen es la Teora de Juegos. El valor de probabilidad de un evento es la cantidad de resultados que estn asociados al evento de inters, respecto del total de resultados posibles (espacio muestral). Esta forma de asignar probabilidad es de uso frecuente. Definicin: Asignacin clsica de probabilidad a eventos Sean S: Espacio muestral A: Evento de inters . Si N(S) y N(A) representan su cardinalidad (nmero de elementos) N(A) Entonces la probabilidad del evento A es: P(A) = N(S) . Ejemplo. Calcule la probabilidad que al lanzar una vez un dado y una moneda se obtenga un nmero impar y sello Si c, s representan los valores cara y sello de la moneda, entonces el espacio muestral es: S = {(1,c),(2,c),(3,c),(4,c),(5,c),(6,c),(1,s),(2,s),(3,s),(4,s),(5,s),(6,s)} Mientras que el evento de inters es: A = {(1,s),(3,s),(5,s)}

Repuesta: P(A) = N(A)/N(S) = 3/12 = 1/4 = 0.25 = 25% Ejemplo. En un grupo de 15 personas, 7 leen la revista A, 5 leen la revista B y 6 ninguna revista. Encuentre la probabilidad que al elegir al azar una persona, sta lea al menos una revista Respuesta: Representacin tabular de datos: Leen A No leen A Leen B 3 2 5 No leen B 4 6 10 7 8 15

50

Ing. Luis Rodriguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

4 nicamente leen A 2 nicamente leen B 3 leen A y B Por lo tanto, 9 personas leen al menos una revista Sean E: Evento que la persona elegida al azar lea al menos una revista S: Incluye todas las formas diferentes para elegir una persona Entonces P(E) = N(E)/N(S) = 9/15 = 0.6 La probabilidad que al elegir al azar tres personas, dos lean ambas revistas y una no lea revistas. Respuesta: Sean E: Evento que dos personas lean ambas revistas y una no lea revistas S: Incluye todas las formas diferentes de elegir tres personas N(S) = 15C3 = 455 Cantidad de formas diferentes de elegir 2 de las 3 que leen ambas 3C2 = 3 Cantidad de formas diferentes de elegir 1 de las 6 que no leen revistas 6C1 = 6 Por el Principio Bsico del Conteo, la cantidad de elementos en el evento E N(E) = 3 x 6 = 18 Por lo tanto P(E) = N(E)/N(S) = 18/455 = 0.0396 = 3.96%

Ejemplo. Suponga que se ha vendido una serie completa de las tablas del Peso Millonario. Calcule la probabilidad que al comprar una tabla usted sea el nico ganador del premio. Respuesta: Sea S: conjunto de tablas del Peso Millonario (cada tabla es diferente y contiene 15 nmeros diferentes elegidos al azar entre los enteros del 1 al 25), N(S) = 25C15 = 3268760 (cantidad de tablas diferentes que se generan) E: evento de tener la tabla premiada (solamente hay una tabla premiada) P(E) = N(E)/N(S) = 1/3268760 0.0000003 (cercano a cero) Para tomar una idea de lo pequeo que es este nmero imagine cual sera su chance de sacar el premio si en una caja hubiesen 1000 tablas entre las que est la tabla ganadora. Usted debe elegir al azar la tabla ganadora. Es muy poco probable que acierte. Ahora suponga que en en una bodega hay 3268 cajas, cada una con 1000 tablas. Primero usted debe elegir al azar la caja que contiene la tabla ganadora, y luego de esta caja elegir al azar la tabla ganadora. Concluimos que su chance de obtener el premio en verdad es un sueo

51

Ing. Luis Rodriguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

3.8.1 PROBABILIDAD DE LOS ELEMENTOS DE UN EVENTO


Cada uno de los elementos de un evento tiene el mismo valor de probabilidad Definicin: Probabilidad de eventos simples S: Espacio muestral, con N puntos muestrales Ei: Evento simple (contiene un solo punto muestral) Entonces para cada evento simple P(Ei) = 1/N, i = 1, 2, 3, ..., N Por lo tanto Sean

. .

P(E ) = 1
i=1 i

Si un evento A contiene k puntos muestrales, entonces P(A)=k (1/N) Ejemplo. Al lanzar un dado, Cual es la probabilidad que al lanzarlo salga un nmero par? Respuesta: S = {1, 2, 3, 4, 5, 6} A = {2, 4, 6} P(A) = P(E1) + P(E2) + P(E3) = 3 (1/6) = 0.5 (evento de inters)

Ejemplo. Suponga que un dado est desbalanceado de tal manera que se conoce que la probabilidad que salga el nmero 6 es el doble que los otros nmeros. Cual es la probabilidad que al lanzarlo salga un nmero par? Respuesta: En este ejempl los puntos muestrales no tienen el mismo la misma probabilidad 1/6. Sea x, probabilidad que salga alguno de los nmeros 1, 2, 3, 4, 5. Por lo tanto, la probabilidad que salga el nmero 6 es el doble, 2x Entonces Sean x + x + x + x + x + 2x = 1 x = 1/7

A: Evento que salga un nmero par, A = {2, 4, 6} Ei: Evento simple correspondiente a cada resultado i P(A) = P(E2) + P(E4) + P(E6) = 1/7 + 1/7 + 2/7 = 4/7

3.9

AXIOMAS DE PROBABILIDAD DE EVENTOS

En esta seccin se introduce la formalidad matemtica para la teora de la probabilidad de eventos. Sea S: Espacio muestral (suponer discreto y finito) E: Evento de S P(E): Probabilidad del evento E : Conjunto de los reales P es una funcin que asocia a cada evento E de S un nmero real P: S , EP(E) dom P = S, rg P = [0, 1] P es una funcin de probabilidad y cumple los siguientes axiomas 1) P(E) 0 2) P(S) = 1 3) E1, E2 S E1 E2 = P(E1 E2) = P(E1) + P(E2)

52

Ing. Luis Rodriguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

El tercer axioma establece que si dos eventos son mutuamente excluyentes entonces la probabilidad del evento unin de estos eventos es la suma de las probabilidades de cada evento. Esta propiedad se puede extender a ms eventos. Algunas propiedades de eventos con demostraciones basadas en los axiomas 1) () = 0 Demostracin: Probabilidad de un evento nulo S = S eventos excluyentes P(S) = P(S) + P() por el axioma 3 1 = 1 + P() por el axioma 2 P() = 0

2) P(Ec) = 1 P(E) Probabilidad del evento complemento eventos excluyentes Demostracin: S = EEc por el axioma 3 P(S) = P(E) + P(Ec) por el axioma 2 1 = P(E) + P(Ec) P(Ec) = 1 P(E) 3) Sean A, B eventos de S, tales que A B, entonces P(A) P(B) Demostracin: Si A est incluido en B se puede escribir B = A (AC B) eventos excluyentes por el axioma 3 P(B) = P(A) + P(AC B) P(B) P(A) por el axioma 1 4) Sea A un evento cualquiera de S, entonces 0 P(A) 1 AS Demostracin P( ) P(A) P(S) por la propiedad 3 0 P(A) 1 por la propiedad 1 y axioma 2 5) P(ABc) = P(A B) = P(A) P(AB) Demostracin: A = (A B)(AB) P(A) = P(A B) + P(AB) P(A B) = P(A) - P(AB) eventos excluyentes axioma 3

6) P(AB) = P(A) + P(B) P(AB) Regla aditiva de la probabilidad Demostracin: AB = (A B)(AB)(B A) eventos excluyentes P(AB) = P(A B) + P(AB) + P(B A) axioma 3 P(AB) = P(A B) + P(AB) + P(B A) + P(AB) P(AB) con la propiedad 5 P(AB) = P(A) + P(B) P(AB) Ejemplo. En un grupo de 15 personas, 7 leen la revista A, 5 leen la revista B y 6 ninguna revista. Encuentre la probabilidad que al elegir al azar una persona, sta lea al menos una revista Respuesta: Representacin tabular para los datos: Leen A No leen A 4 nicamente leen A 2 nicamente leen B 3 leen A y B Entonces, 9 personas leen al menos una revista Leen B 3 2 5 No leen B 4 6 10 7 8 15

53

Ing. Luis Rodriguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Usamos ahora las reglas de la probabilidad de eventos para resolver este problema Sean los eventos A: la persona elegida al azar lea la revista A B: la persona elegida al azar lea la revista B AB: la persona elegida al azar lee al menos una revista Por lo tanto P(AUB) = P(A) + P(B) - P(AB) = 7/15 + 5/15 3/15 = 9/15 = 0.6

Ejemplo. Sean A, B eventos de S, tales que P(A) = 0.35, P(Bc) = 0.27, P(AcB) = 0.59 Calcule a) P(AB) b) P(AB) c) P(ABc) d) P(AcBc) Respuesta Una representacin tabular de los valores de probabilidad facilita los clculos. A Ac B 0.14 0.59 0.73 Bc 0.21 0.06 0.27 0.35 0.65 1

Cada respuesta se la obtiene directamente de la tabla: a) P(AB) = 0.14 b) P(AB) = P(A) + P(B) - P(AB) = 0.35 + 0.73 - 0.14 = 0.94 c) P(ABc) = P(A) + P(Bc) P(ABc) = 0.35 + 0.27 0.21 = 0.41 d) P(AcBc) = P(Ac) + P(Bc ) P(AcBc)= 0.65 + 0.27 0.06 = 0.86

LAS PROPIEDADES PUEDEN EXTENDERSE A MS EVENTOS


Sean A, B, C, tres eventos del espacio muestral S Definiciones Si A, B, C son eventos mutuamente excluyentes, P(ABC) = P(A) + P(B) + P(C) Si A, B, C son eventos cualesquiera P(ABC) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC)

54

Ing. Luis Rodriguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) En una fbrica hay cinco motores, de los cuales tres estn defectuosos. Calcule la probabilidad que al elegir dos motores al azar, a) Ambos estn en buen estado b) Solamente uno est en buen estado c) Al menos uno est en buen estado 2) En un grupo de 60 estudiantes, 42 estn registrados en Anlisis Numrico, 38 en Estadstica y 10 no estn registrados en ninguna de estas dos materias. Calcule la probabilidad que al elegir entre los 60 algn estudiante al azar, a) Est registrado nicamente en Estadstica b) Est registrado en ambas materias 3) Sean A, B eventos cualesquiera de un espacio muestral. Si P(A)=0.34, P(B)=0.68, P(AB)=0.15, calcule a) P(AB) b) P(ABc) c) P(AcBc) 4) En una encuesta en la ciudad se ha hallado que La probabilidad que una familia tenga TV es 0.7 La probabilidad que una familia tenga reproductor de DVD es 0.4 La probabilidad que una familia tenga TV pero no tenga reproductor de DVD es 0.36 Calcule la probabilidad que una familia tenga ni TV ni reproductor de DVD a) Use una representacin tabular b) Use nicamente reglas de probabilidad

55

Ing. Luis Rodriguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

3.10 PROBABILIDAD CONDICIONAL


La probabilidad de un evento puede depender o estar condicionada a la probabilidad de otro evento. Ejemplo. Un experimento consiste en lanzar una vez un dado y una moneda. Si c, s representan los valores cara y sello de la moneda, entonces el espacio muestral S es: S = {(1,c),(2,c),(3,c),(4,c),(5,c),(6,c),(1,s),(2,s),(3,s),(4,s),(5,s),(6,s)} Sea el evento de inters, A: obtener el nmero 5 y sello Entonces P(A) = 1/12 0.0833

Ahora, suponga que luego de lanzar el dado y la moneda, nos informan que el nmero del dado fue impar. Cual es la probabilidad del evento A dado el evento indicado? Sea B este evento conocido: B = {(1,c),(3,c),(5,c),(1,s),(3,s),(5,s)}

Entonces, la probabilidad del evento A dado el evento B, es 1/6 0.1667

Definicin: Probabilidad condicional Sean A, B eventos de S La probabilidad condicional del evento A dado el evento B se escribe P(A|B) y es:

P(A | B) =

P(A B) , P(B) 0 P(B)

Para justificar esta importante frmula, suponga que S contiene solo dos eventos, A y B. En la siguiente tabla se ha escrito simblicamente el nmero de elementos de cada evento, siendo N el total de elementos del espacio muestral B A Ac Entonces,
n1 n1 P(A B) N P(A | B) = = = n1 + n3 n1 + n3 P(B) N P(A|B) es una funcin de probabilidad pues cumple los axiomas anteriormente expuestos.

Bc

n1 n3

n2 n4
N

Ejemplo.- Use la frmula de la probabilidad condicional para el ejemplo anterior, AB = {(5, s)}

P(A | B) =

P(A B) 1/12 = = 1/ 6 P(B) 6/12

56

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. Las enfermedades A y B son comunes entre las personas de una regin. Suponga conocido que 10% de la poblacin contraer la enfermedad A, 5% la enfermedad B, y 2% ambas enfermedades. Encuentre la probabilidad que cualquier persona a) Contraiga al menos una enfermedad b) Contraiga la enfermedad A pero no B c) Contraiga la enfermedad A dado que ya contrajo B d) Contraiga la enfermedad B dado que no contrajo A e) Contraiga ambas enfermedades dado que ya contrajo al menos una. Para facilitar el clculo completamos el cuadro de probabilidades, siendo A y B los eventos que corresponden a contraer las enfermedades A y B respectivamente B 0.02 0.03 0.05 Bc 0.08 0.87 0.95

A Ac

0.10 0.90 1

Ahora se puede expresar cada pregunta en forma simblica y obtener la respuesta directamente de cuadro Respuestas a) P(AB) = P(A) + P(B) P(AB) = 0.1 + 0.05 0.02 = 0.13 = 13% b) P(ABc) = 0.08 = 8% c) P(A|B) = P(AB)/P(B) = 0.02/0.05 = 0.4 = 40% d) P(B|Ac) = P(BAc)/P(Ac) = 0.03/0.9 = 0.3 = 30% e) P(AB)|P(AB)=P[(AB) (AB)]/P(AB)=P(AB)/P(AB) = 0.02/0.13 = 0.1538

Ejemplo. En una empresa hay 200 empleados, de los cuales 150 son graduados, 60 realizan trabajo administrativo. De estos ltimos, 40 son graduados. Si se toma al azar un empleado, encuentre la probabilidad que, a) Sea graduado y no realiza trabajo administrativo. b) Sea graduado dado que no realiza trabajo administrativo. c) No sea graduado dado que realiza trabajo administrativo Para facilitar el clculo completamos el cuadro con la cantidad de elementos de cada evento que los representamos con: G: el empleado es graduado A: el empleado realiza trabajo administrativo A Ac G 40 110 150 Gc 20 30 50 200 60 140 Como antes, los datos faltantes se los ha completado con color azul Ahora se puede expresar cada pregunta en forma simblica y obtener la respuesta inmediatamente Respuestas a) P(GAc) = 110/200 = 0.55 b) P(G|Ac) = P(GAc)/P(Ac) = (110/200) / (140/200) = 110/140 = 0.7857 c) P(Gc|A) = P(GcA)/P(A) = (20/200) / (60/200) = 20/60 = 0.3333

57

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) Sean los eventos A, B tales que P(A)=0.4, P(B)=0.3, P(AB)=0.1, encuentre a) P(A|B) b) P(B|A) c) P(A|AB) d) P(A|AB) e) P(AB|AB) 2) En un club de amigos, 10 practican tenis, 7 practican ftbol, 4 practican ambos deportes y los restantes 5 no practican algn deporte. Si se elige una de estas personas al azar, calcule la probabilidad que, a) Al menos practique un deporte b) No practique tenis c) Practique tenis y no practique ftbol d) Practique tenis dado que no practica ftbol 3) En una granja se tiene que la probabilidad que un animal tenga la gripe aviar es 0.3. La probabilidad que la reaccin a una prueba sea negativa para un animal sano es 0.9, y que sea positiva para un animal enfermo es 0.8 a) Calcule la probabilidad que para un animal elegido al azar, el examen sea positivo b) Calcule la probabilidad que el animal elegido al azar est enfermo, dado que el examen fue positivo

58

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

3.11 EVENTOS INDEPENDIENTES


Sean A y B eventos cualesquiera de un espacio muestral S, se dice que A y B son independientes si P(A|B) = P(A) y P(B|A) = P(B), es decir que el evento A no depende del evento B y el evento B no depende del evento A Lo anterior es equivalente a la siguiente definicin Definicin: Eventos independientes A y B son eventos independientes si P(AB) = P(A) P(B)

Demostracin: De la definicin de probabilidad condicional, P(A|B) = P(AB)/P(B), P(B)0 Si A y B son independientes: P(A|B) = P(A). Sustituir en la frmula de probabilidad condicional: P(A) = P(AB)/P(B) De donde se despeja P(AB)

Ejemplo. Calcule la probabilidad que el ltimo dgito de un nmero de cinco dgitos elegido al azar, sea 7 y el penltimo dgito del mismo nmero sea 5 Sean los eventos A: el ltimo digito es 7 B: el penltimo dgito es 5 Cada evento no est relacionado con el otro: son independientes, por lo tanto, P(AB) = P(A) P(B) = 0.1 x 0.1 = 0.01

Ejemplo. En una caja hay 10 bateras de las cuales 4 estn en buen estado. Se repite dos veces el siguiente ensayo: extraer una batera al azar, revisar su estado y devolverla a la caja. Encuentre la probabilidad que en ambos intentos se obtenga una batera en buen estado. Sean los eventos A: la primera batera est en buen estado B: la segunda batera est en buen estado Al devolver la batera a la caja, el evento A no afecta al evento B, por lo tanto son independientes: P(AB) = P(A) P(B) = 0.4 x 0.4 = 0.16 Calcule la probabilidad que en los dos intentos se obtenga al menos una batera en buen estado Con la conocida frmula aditiva de probabilidad, P(AB) = P(A) + P(B) P(AB) = 0.4 + 0.4 0.16 = 0.64

59

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Pregunta. Suponer que A, B son eventos no nulos, mutuamente excluyentes, de un espacio muestral S. Son A y B independientes? Si A, B son eventos no nulos, P(A)>0, P(B) >0 P(A) P(B) >0 Pero siendo A y B excluyentes, AB = P(AB) = 0 Por lo tanto, A y B no pueden ser independientes pues P(AB) P(A) P(B) Tambin, se tiene que si A, B son excluyentes: P(A|B)=P(AB)/P(B) = 0 Pero si A, B son independientes se debe cumplir: P(A|B) = P(A) Por lo tanto A, B no pueden ser independientes Pregunta. Si A, B son eventos no nulos e independientes, son excluyentes? Si A, B son eventos independientes y no nulos: P(AB) = P(A) P(B) > 0 Pero P(AB) > 0 AB Por lo tanto A, B no pueden ser excluyentes NOTA: Ambos enunciados son lgicamente equivalentes Sean, p: A y B son excluyentes, q: A y B son independientes p q q p

La definicin de independencia entre eventos puede extenderse a ms eventos Definicin: Eventos independientes para ms eventos Si A, B, C son eventos mutuamente independientes, entonces P(ABC) = P(A) P(B) P(C) .

3.12 REGLA MULTIPLICATIVA DE LA PROBABILIDAD


Sean A, B eventos no nulos cualquiera de S, entonces Definicin: Regla multiplicativa de la probabilidad P(AB) = P(A) P(B|A) Esta frmula se la obtiene directamente despejando P(AB) de la definicin de Probabilidad Condicional

Ejemplo. En una caja hay 10 bateras de las cuales 4 estn en buen estado. Se extraen al azar dos bateras sin devolverlas a la caja. Encuentre la probabilidad que, a) Ambas estn en buen estado b) Solamente una est en buen estado c) Al menos una est en buen estado d) Ninguna est en buen estado Sean los eventos A: La primera batera est en buen estado B: La segunda batera est en buen estado a) La probabilidad que ambas estn en buen estado es P(AB), pero los eventos A y B no son independientes pues B depende del resultado de A. Entonces con la frmula anterior 4 3 P(AB) = P(A) P(B|A) = ( )( ) = 2/15 =0.1333 10 9

60

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

La probabilidad de xito del evento A es 4/10. Para el evento B es 3/9, dado que A es favorable, pues quedan 3 bateras en buen estado del total de 9 bateras b) La probabilidad que una batera est en buen estado y la otra en mal estado: P(ABc) + P(AcB) = P(A)P(Bc|A) + P(Ac)P(B|Ac) = (4/10)(6/9) + (6/10)(4/9) = 12/15 = 0.5333 Los eventos en los que solamente la primera batera est en buen estado o que solamente la segunda batera est en buen estado son excluyentes, por lo que sus probabilidades se suman. c) La probabilidad que al menos una est en buen estado. Usando los resultado calculados en a) y b): P(AB) = P(AB)P(ABc)P(AcB) = 2/15 + 8/15 = 2/3 =0.6666 Equivale a decir que ambas estn en buen estado o que solamente una est en buen estado y siendo eventos excluyentes, sus probabilidades se suman d) La probabilidad que ninguna est en buen estado P((AB)c) = 1 P(AB) = 1 2/3 = 1/3 = 0.3333 Es lo contrario de que al menos una est en buen estado. El ejemplo anterior tambin puede resolverse con las frmulas de conteo conocidas a) A: evento que ambas bateras estn en buen estado N(A): cantidad de formas de sacar 2 en buen estado de las 4 existentes: N(S): cantidad de formas de sacar 2 bateras del total de 10 bateras P(A) = N(A) / N(S) = 4C2 / 10C2 = 2/15 b) A: Evento en el que una batera est en buen estado y la otra est en mal estado. Este evento incluye las formas de sacar una batera en buen estado de las 4 existente: 4C1, y una en mal estado de las 6 existentes: 6C1 P(A) = 4C1 6C1 / 10C2 = 8/15 c) A: ambas bateras en buen estado B: solamente una batera en buen estado A y B son eventos excluyentes, por lo tanto P(AB) = P(A) + P(B) = 2/15 + 8/15 = 10/15 = 2/3

La regla multiplicativa puede extenderse a ms eventos. Definicin: Regla multiplicativa de la probabilidad para ms eventos Sean A, B, C eventos cualesquiera de S, entonces P(ABC) = P(A) P(B|A) P(C|AB)

61

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. En el ejemplo anterior de las 10 bateras con 4 en buen estado, encuentre la probabilidad que al extraer tres sin devolverlas, las tres estn en buen estado Usando la Regla Multiplicativa, siendo A, B, C eventos que corresponden a sacar la primera, segunda y tercera batera en buen estado, P(ABC) = (4/10) (3/9) (2/8) = 1/30 = 0.0333 = 3.33% Este ejemplo tambin se puede resolver usando las frmulas de conteo conocidas Sean A: Evento que las tres bateras estn en buen estado N(A): cantidad de formas de tomar 3 en buen estado de las 4 existentes N(S): cantidad de formas te tomar 3 bateras del total de 10 P(A) = N(A) / N(S) = 4C3 / 10C3 = 1/30

Ejemplo. Para ensamblar una mquina se usan dos componentes electrnicos. Suponga que la probabilidad que el primer componente cumpla las especificaciones es 0.95, y para el segundo es 0.98. Adems, los componentes funcionan independientemente. Encuentre la funcin de distribucin de probabilidad del nmero de componentes que cumplen las especificaciones, x = 0, 1, 2 Sea X: variable aleatoria discreta (nmero de componentes que cumplen las especificaciones) x = 0, 1, 2 Sean los eventos: A: el primer componente cumple las especificaciones B: el segundo componente cumple las especificaciones AC: el primer componente no cumple las especificaciones BC: el segundo componente no cumple las especificaciones Entonces P(X=0) = P(AC)P(BC) = (1 - 0.05)(1 - 0.98) = 0.001 (Son eventos independientes) P(X=1) = P(A - B) + P(B - A) = P(ABC) + P(BAC) = 0.95(1-0.98) + 0.98(1-0.95) = 0.068 P(X=2) = P(A)P(B) = (0.95)(0.98) = 0.931 (Son eventos independientes) Por lo tanto, la funcin de distribucin de probabilidad de la variable aleatoria X es x 0 1 2 f(x) = P(X=x) 0.001 0.068 0.931

Estos resultados se fundamentan en la propiedad de que si A, B son eventos independientes, entonces tambin AC, BC son eventos independientes.

62

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) Dos jugadores de ftbol realizan un disparo cada uno. Se conoce que la probabilidad de xito del primero es 0.7 mientras que la probabilidad de xito del segundo jugador es 0.6. Calcule la probabilidad que a) Ambos jugadores tengan xito. b) Ninguno tenga xito. c) Al menos uno tenga xito 2) Dos alarmas contra incendio funcionan independientemente. La probabilidad de xito de deteccin de la primera es 0.95, mientras que para la segunda es 0.9. Calcule la probabilidad que: a) Al menos una alarma tenga xito. c) Solamente una alarma tenga xito. 3) Sean A, B eventos independientes. Demuestre que los eventos Ac, Bc tambin son eventos independientes.

63

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

3.13 PROBABILIDAD TOTAL


Existen situaciones en las cuales varios eventos intervienen en la realizacin de algn otro evento del mismo espacio muestral. Consideremos un caso de inters. Sean B1, B2, ... ,BK eventos mutuamente excluyentes de S y que constituyen una particin de S, es decir, cumplen las siguientes propiedades: a) i,j (BiBj = , i j) (Los eventos son mutuamente excluyentes) b) B1B2 ... BK = S (La unin de todos estos eventos es S)
B B B B B

Sea A un evento cualquiera de S. La realizacin de A depende de los eventos B1, B2, ... ,BK El siguiente grfico permite visualizar esta relacin entre eventos:

Para los eventos descritos anteriormente, la siguiente frmula permite calcular la probabilidad del evento A mediante la probabilidad de los eventos B1, B2, ... ,BK Definicin Frmula de la Probabilidad Total P(A) = P(B1) P(A|B1)+P(B2) P(A|B2)+...+P(Bk) P(A|Bk) = P(Bi )P(A | Bi )
B B B B

i=1

Demostracin A = (AB1)(AB2) ... (ABK)


B B B

Unin de eventos excluyentes


B

P(A) = P(AB1) + P(AB2) + ... + P(ABK)


B B B B B

Por el axioma 3 de probabilidad


B

P(A) = P(B1) P(A|B1)+P(B2) P(A|B2)+...+P(Bk) P(A|Bk) Con la definicin de probabilidad condicional

Ejemplo. Una institucin tiene a tres personas para atender a sus clientes: Mara, Carmen y Beatriz. Se dispone de un registro de quejas por la atencin recibida: 1%, 3%, 2% respectivamente. Cierto da acudieron 50 clientes a la institucin, de los cuales 15 fueron atendidos por Mara, 10 por Carmen y 25 por Beatriz. Calcule la probabilidad que un cliente elegido al azar de entre los que fueron atendidos ese da se queje por la atencin recibida.

64

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Solucin. Los datos disponibles son Persona Mara Carmen Beatriz Clientes atendidos 15 10 25 Probabilidad de queja 1% 3% 2%

Si se definen los eventos de la siguiente manera A: El cliente elegido presenta una queja B1: El cliente fue atendido por Mara B2: El cliente fue atendido por Carmen B3: El cliente fue atendido por Beatriz B1, B2, y B3 son eventos que conforman una particin, y contribuyen a la realizacin de otro evento, A. Por lo tanto es un problema de probabilidad total:
B B B B

P(A) = P(B1) P(A|B1) + P(B2) P(A|B2) + P(B3) P(A|B3) = (15/50)0.01 + (10/50)0.03 + (25/50)0.02 = 0.019 = 1.9%
B B B

Ejemplo. Una fbrica tiene tres mquinas M1, M2, M3 para la produccin de sus artculos. El siguiente cuadro describe el porcentaje de produccin diaria de cada una y la frecuencia de artculos defectuosos que producen cada una. Mquina M1 M2 M3 Produccin 50% 30% 20% Artculos defectuosos 4% 3% 2%

Determine la probabilidad que un artculo elegido al azar de la produccin total de un da, sea defectuoso. Solucin Sea A: evento que el artculo elegido sea defectuoso El evento A depende de B1, B2, B3 que representan los eventos de que un artculo sea producido por las mquinas: M1, M2, M3 respectivamente. Estos eventos forman una particin por lo que usamos la frmula de la probabilidad total
B

P(A) = P(B1) P(A|B1) + P(B2) P(A|B2) + P(B3) P(A|B3) = (0.5)(0.04) + (0.3)(0.02) + (0.2)(0.03) = 0.032 = 3.2%
B B B

Ejemplo. En una primera caja hay 20 bateras de las cuales 18 estn en buen estado. En una segunda caja hay 10 bateras de las cuales 9 estn en buen estado. Se realiza un experimento que consiste en las siguientes dos acciones: Primero se toma al azar de la caja 2 una batera y sin examinarla se la coloca en la caja 1. Segundo, se toma al azar una batera de la caja 1 y se la examina. Encuentre la probabilidad que esta ltima batera est en buen estado.

65

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Respuesta El siguiente grfico describe el experimento:

Sean los eventos B: La batera tomada de la caja 2 y colocada en la caja 1 est en buen estado La batera tomada de la caja 2 y colocada en la caja 1 no est en buen estado Bc: A: La batera tomada de la caja 1 est en buen estado El evento A depende de los eventos B y Bc, los cuales son excluyentes y forman una particin. De ellos depende el evento A. Entonces con la frmula de la Probabilidad Total: P(A) = P(B) P(A|B) + P(Bc) P(A|Bc) = (9/10)(19/21) + (1/10)(18/21) = 0.9

3.14 FRMULA DE BAYES


Sean B1, B2, ... ,BK eventos no nulos mutuamente excluyentes de S y que constituyen una particin de S, y sea A un evento no nulo cualquiera de S
B

La siguiente frmula se denomina Frmula de Bayes y permite calcular la probabilidad correspondiente a cada uno de los eventos de los que depende otro evento, dado que este ya sucedi. Definicin: Frmula de Bayes P(Bi|A) =
P(Bi ) P(A | Bi ) P(B ) P(A | Bi ) , i=1, 2, ..., k = K i P(A) P(Bi ) P(A | Bi )
I= 1

Demostracin. Por la definicin de probabilidad condicional: P(Bi A) P(Bi ) P(A | Bi ) = , i = 1, 2, ... ,k P(Bi|A) = P(A) P(A) Ejemplo. En el ejemplo anterior de la fbrica, suponga que el artculo elegido al azar fue defectuoso. Determine la probabilidad que haya sido producido por la mquina M1: Solucin: P(B1|A) =

P(B1 ) P(A | B1 ) (0.50)(0.04) = = 0.625 = 62.5% P(A) 0.032

Ejemplo. Sean A, B eventos de algn S. Se conoce que P(B) = 0.4 P(A|B) = 0.3 P(A|Bc) = 0.8 Encuentre a) P(A), b) P(B|A) c) P(B|Ac)

66

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Respuesta: Para facilitar la interpretacin de este problema colocamos los datos en un diagrama de rbol y con un Diagrama de Venn visualizamos los eventos. Los datos los escribimos en color negro. Los valores faltantes los completamos en azul. Los eventos B y Bc constituyen una particin y determinan la realizacin del evento A.

Con los valores indicados en el diagrama y las frmulas de Probabilidad Total y el Teorema de Bayes se obtienen las respuestas: a) P(A) = P(B) P(A|B) + P(Bc) P(A|Bc) = (0.4)(0.3) + ((0.6)(0.8) = 0.6 b) P(B|A) = P(BA)/P(A) = P(B) P(A|B) / P(A) = (0.4) (0.3) / 0.6 = 0.2 c) P(B|Ac) = P(BAc)/P(Ac) = P(B) P(Ac|B) / P(Ac) = (0.4) (0.7) / 0.4 = 0.7

EJERCICIOS
1) La Comisin de Trnsito del Guayas ha implantado un sistema de control de velocidad mediante un radar colocado en cuatro puntos de la ciudad: X1, X2, X3, X4. Cada da, estos aparatos estn activos en los sitios indicados, 16 horas, 10 horas, 12 horas y 15 horas respectivamente en horarios al azar. Una persona maneja a su trabajo diariamente y lo hace con exceso de velocidad y la probabilidad de que pase por alguno de estos sitios es respectivamente 0.3, 0.1, 0.4 y 0.2 a) Calcule la probabilidad que en algn da reciba una multa por exceso de velocidad. b) Cierto da, la persona recibi una multa por exceso de velocidad. Determine el sitio en que hay la mayor probabilidad de haber sido multado. 2) Para concursar por una beca de estudio en el exterior se han presentado a rendir un examen 10 estudiantes de la universidad X1, 20 de la universidad X2 y 5 de la universidad X3. De experiencias anteriores, se conoce que las probabilidades de xito en el examen son respectivamente: 0.9, 0.6, 0.7 a) Calcule la probabilidad que un estudiante elegido al azar apruebe el examen b) Calcule la probabilidad condicional de que un estudiante elegido al azar y que haya aprobado el examen, sea de la universidad X1.

67

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

VARIABLES ALEATORIAS DISCRETAS

En el material estudiado anteriormente aprendimos a calcular la probabilidad de eventos de un espacio muestral S. En esta unidad estudiaremos reglas para establecer correspondencias de los elementos de S con los nmeros reales, para luego asignarles un valor de probabilidad. Ejemplo. En un experimento se lanzan tres monedas y se observa el resultado (c: cara o s: sello). El conjunto de posibles resultados para este experimento, es el siguiente espacio muestral: S = {( c, c, c),( c, c, s),( c, s, c),( s, c, c),( c, s, s),( s, c, s),( s, s, c),( s, s, s)} Suponga que es de inters conocer el nmero de sellos que se obtienen. Los posibles resultados se los puede representar mediante una variable. Si X representa a esta variable, entonces se dice que X es una variable aleatoria: X: Variable aleatoria (nmero de sellos que se obtienen) Al realizar el experimento, puede resultar cualquier elemento del espacio muestral S. Por lo tanto, la variable aleatoria X puede tomar cualquiera de los nmeros: 0, 1, 2, 3.

Las variables aleatorias establecen correspondencia del espacio muestral S al conjunto de los nmeros reales. Esta correspondencia es una funcin y se la puede definir formalmente. Definicin: Variable aleatoria X: Variable aleatoria S: Espacio muestral e: Cualquier elemento de S x: Valor que puede tomar X : Conjunto de los nmeros reales Entonces X: S Es la correspondencia que establece la variable aleatoria X e x, dom X = S, rg X . Sean

Ejemplo: Tabule la correspondencia que establece la variable aleatoria X del ejemplo anterior: S = {( c, c, c),( c, c, s),( c, s, c),( s, c, c),( c, s, s),( s, c, s),( s, s, c),( s, s, s)} X: variable aleatoria (Nmero de sellos que se obtienen) x = 0, 1, 2, 3

x (valor de X) ( c, c, c) 0 ( c, c, s) 1 ( c, s, c) 1 ( s, c, c) 1 ( c, s, s) 2 ( s, c, s) 2 ( s, s, c) 2 ( s, s, s) 3 dom X= S, rg X = {0, 1, 2, 3}


Para un mismo espacio muestral S pueden definirse muchas variables aleatorias. Para el ejemplo de las 3 monedas, algunas otras variables aleatorias que se pueden definir sobre S, pudieran ser Y: Diferencia entre el nmero de caras y sellos Z: El nmero de caras al cubo, mas el doble del nmero de sellos, etc.

e (elemento de S)

68

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Para cada variable aleatoria el rango es un subconjunto de los reales. Segn el tipo de correspondencia establecida, las variables aleatorias pueden ser discretas o continuas. En el ejemplo de las monedas, X es una variable aleatoria discreta pues su rango es un subconjunto de los enteros. Adems es finita. Ejemplo. En un experimento se lanza repetidamente una moneda. Determine el rango y tipo de la variable aleatoria discreta siguiente: X: Cantidad de lanzamientos realizados hasta que sale un sello S={( s), (c, s), (c, c, s), (c, c, c, s), ...}, resultados posibles rg X = {1, 2, 3, 4, ...} X es una variable aleatoria discreta infinita

4.1

DISTRIBUCIN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS

Cada valor de una variable aleatoria discreta puede asociarse con un valor de probabilidad Definicin: Probabilidad de una variable aleatoria discreta Sea X: Variable aleatoria discreta Entonces, P(X=x) representa la probabilidad que la variable X tome el valor x

La correspondencia que define P(X=x) es una funcin y se denomina distribucin de probabilidad de la variable aleatoria X. Esta correspondencia puede definirse formalmente: Definicin: Distribucin de probabilidad de una variable aleatoria discreta X X: Variable aleatoria discreta f(x) = P(X=x) probabilidad que X tome el valor x Entonces, la corresponencia f: X , x f(x) = P(X=x), dom f = X, rg f [0, 1] Es la distribucin de probabilidad de la variable aleatoria X Sean

f es una funcin de probabilidad, por lo tanto su rango est en el intervalo [0, 1] Definicin: Propiedades de la distribucin de probabilidad de una variable aleatoria discreta Sean X: variable aleatoria discreta f(x): distribucin de probabilidad de X Propiedades de f(x) 1) x f(x) 0 Los valores de probabilidad no pueden ser negativos 2) f(x) = 1 La suma de todos los valores de probabilidad de f(x) es 1
X

La correspondencia que establece f puede describirse en forma tabular como en el ejemplo de las tres monedas. Tambin puede describirse grficamente, y en algunos casos mediante una frmula matemtica como se ver despus.

69

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. En el experimento de lanzar tres monedas y observar el resultado de cada una: cara(c), o sello(s). Encuentre la distribucin de probabilidad , en forma tabular, de la variable aleatoria X: cantidad de sellos que se obtienen Espacio muestral: S = {( c, c, c),( c, c, s),( c, s, c),( s, c, c),( c, s, s),( s, c, s),( s, s, c),( s, s, s)} e (elemento de S) x (valor de X) ( c, c, c) 0 ( c, c, s) 1 ( c, s, c) 1 ( s, c, c) 1 ( c, s, s) 2 ( s, c, s) 2 ( s, s, c) 2 ( s, s, s) 3 Los valores de probabilidad para este ejemplo se pueden obtener del conteo de valores de x: El valor 0 ocurre 1 vez entre 8, el valor 1 ocurre 3 veces entre 8, etc

x
0 1 2 3

P(X=x)
1/8 3/8 3/8 1/8

Ejemplo. En un lote de 5 artculos, 3 son defectuosos y 2 aceptables. Se toma una muestra aleatoria de 2 artculos. Encuentre la distribucin de probabilidad de la variable aleatoria correspondiente a la cantidad de artculos defectuosos que se obtienen en la muestra. Respuesta Sean: a, b, c: artculos defectuosos d, e: artculos aceptables Cantidad de formas diferentes de obtener la muestra de 2 artculos cualesquiera N(S) = 5C2 =10 S = {(a, b), (a, c), (a, d), (a, e), (b, c), (b, d), (b, e), (c, d), (c, e), (d, e)} Sea X: Variable aleatoria discreta (cantidad de artculos defectuosos) x = 0, 1, 2 Distribucin de probabilidad de X en forma tabular. Se obtiene mediante un conteo directo x f(x)=P(X=x) 0 1/10 1 6/10 2 3/10

Ejemplo. Sea X una variable aleatoria discreta cuya distribucin de probabilidad est dada por
kx 2 ,x = 0,1,2,3 f(x) = P(X=x) = 0, otro x

Encuentre P(X=2)

Respuesta.

Por la propiedad 2)
2

f(x) = 1
X

x=0

kx2 = k(0)

x 2 ,x = 0,1,2,3 + k(1)2 + k(2)2 + k(3)2 = 1 k = 1/14 f(x) = P(X=x) = 14 0, otro x


2

Por lo tanto, P(X=2) = (1/14)(2) = 2/7

70

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. Grafique un histograma de la distribucin de probabilidad para el ejemplo de las tres monedas

4.2

DISTRIBUCIN DE PROBABILIDAD ACUMULADA DE VARIABLES ALEATORIAS DISCRETAS

Tambin es importante conocer la probabilidad que la variable aleatoria tome algn valor menor o igual que un valor dado. Esta funcin se denomina Distribucin de Probabilidad Acumulada y su dominio incluye a todos los nmeros reales Definicin: Distribucin de Probabilidad Acumulada F de la variable aleatoria X Sean X: f: F: Entonces Variable aleatoria discreta, Distribucin de probabilidad de la variable aleatoria discreta X Distribucin de probabilidad acumulada de la variable aleatoria discreta X

F(x) = P(Xx) =

f (t )
t x

es la distribucin de probabilidad acumulada de X

Correspondencia funcional de la distribucin de probabilidad acumulada F: , dom F = , rg F [0, 1] Ejemplo. Encuentre la distribucin de probabilidad acumulada para el ejemplo de las tres monedas Respuesta: Sea X: variable aleatoria discreta (cantidad de sellos), Su distribucin de probabilidad es:

x
0 1 2 3 Entonces, F(0) = P(X0) = F(1) = P(X1) = F(2) = P(X2) = F(3) = P(X3) =

f(x)=P(X=x)
1/8 3/8 3/8 1/8

f(t) = f(0) =1/8 f(t) = f(0) + f(1)= 1/8 + 3/8 = 1/2 f(t) = f(0) + f(1) + f(2) = 1/8 + 3/8 + 3/8 = 7/8
t2 t3 t 1 t0

f(t) = f(0) + f(1) + f(2) + f(3) = 1

71

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Distribucin de probabilidad acumulada de la vaiable aleatoria X:


x<0 0, 1/ 8, 0 x < 1 F(x) = 1/ 2, 1 x < 2 7 / 8, 2 x < 3 x3 1,

La distribucin acumulada puede graficarse

Ejemplo. Grafique la distribucin acumulada del ejemplo anterior

Definicin: propiedades de la distribucin acumulada para variables aleatorias discretas 1) 0 F(x )1 2) a b F(a) F(b) 3) P(X>a) = 1 P(Xa) = 1 F(a) F es funcin de probabilidad F es creciente Complemento .

El dominio de F es el conjunto de los nmeros reales, por lo tanto es vlido evaluar F(x) para cualquier valor real de x.

Ejemplo. Calcule algunos valores de F(x) para el ejemplo anterior F(2.5) = P(X 2.5) = 7/8 F(-3.4) = 0 F(24.7) = 1

72

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) Sea X una variable aleatoria discreta y su funcin de distribucin de probabilidad: 2x + 1 f(x) = ,x = 0, 1, 2, 3, 4 25 a) Verifique que f satisface las propiedades de las distribuciones de probabilidad b) Grafique f mediante un histograma c) Calcule P(X=3), P(2X<4) 2) Para ensamblar una mquina se usan dos componentes mecnicos. Suponga que la probabilidad que el primer componente cumpla las especificaciones es 0.95, y para el segundo es 0.98. Adems, los componentes funcionan independientemente. Encuentre la funcin de distribucin de probabilidad del nmero de componentes que cumplen las especificaciones, X = 0, 1, 2 3) Respecto al ejercicio 1) a) Encuentre y grafique la funcin de distribucin acumulada F c) Usando F calcule P(X<1.25), P(1.5<X3), P(X<2.5 X>3.2)

MATLAB
Probabilidad con variables aleatorias discretas >> x = [0 1 2 3]; >> f = [1/8 3/8 3/8 1/8]; >> bar(f, 1, 'y'), grid on Valores de una variable aleatoria X Distribucin de probabilidad f(x) Histograma de probabilidad, color amarillo

El grfico est en una pgina anterior

>> F=cumsum(f) F= 1/8 1/2 7/8

Probabilidad acumulada F(x) 1

73

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

4.3

VALOR ESPERADO DE UNA VARIABLE ALEATORIA DISCRETA

El valor esperado o media es una medida estadstica que describe la tendencia central de una variable aleatoria. Podemos pensar que representa el valor promedio que tomara la variable aleatoria si el experimento se realizara un gran nmero de veces en condiciones similares. Definicin: Valor esperado o media de una variable aleatoria discreta X: variable aleatoria discreta f(x): distribucin de probabilidad de X , o E(X) representan el valor esperado de la variable aleatoria X Entonces: = E(X) = xf (x ) es la media o valor esperado de X x Es la suma de los valores de X ponderados con su valor de probabilidad Sean

Ejemplo. Calcule el valor esperado de la variable aleatoria X en el experimento de lanzar tres monedas, siendo X el nmero de sellos que se obtienen Respuesta: De un ejemplo anterior, se tiene la distribucin de probabilidad de X: x f(x)=P(X=x) 0 1/8 1 3/8 2 3/8 3 1/8 Entonces, el valor esperado de X es: 3 = E(X) = xf ( x ) = 0(1/8) + 1(3/8) + 2(3/8) + 3(1/8) = 1.5 x=0 Significa que si se realizaran un gran nmero de ensayos, en promedio se obtendran 1.5 sellos.

En el ejemplo anterior, el valor esperado est en el centro de la distribucin de los valores de X. Esto se debe a que la distribucin de probabilidad de X es simtrica por lo tanto el valor esperado es el valor central del dominio de X. Ejemplo. En el experimento de obtener muestras del lote de 5 artculos, encuentre el valor esperado de la variable aleatoria X: nmero de artculos defectuosos. Respuesta: Se tiene la distribucin de probabilidad de X: x f(x)=P(X=x) 0 1/10 1 6/10 2 3/10 Entonces, el valor esperado de X es: 2 = E(X) = xf ( x ) = 0(1/10) + 1(6/10) + 2(3/10) = 1.2, (artculos defectuosos) x=0

74

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

En este ejemplo, el valor esperado no est en el centro de la distribucin de los valores de X. Esto se debe a que la distribucin de probabilidad de X no es simtrica. Se puede entender que el valor esperado debe estar en la regin de X en la que se concentran los valores que tienen mayor probabilidad de ocurrir.

4.3.1 VALOR ESPERADO DE EXPRESIONES CON UNA VARIABLE ALEATORIA


Estas expresiones tambin son variables aleatorias y su dominio es el mismo que el dominio de la variable aleatoria, pero el rango puede ser diferente. Definicin: Valor esperado de expresiones con una variable aleatoria X: Variable aleatoria discreta f(x): Distribucin de probabilidad de X G(X): Alguna expresin con la variable aleatoria X Entonces G(X) = E[G(X)] = G(x)f(x) es la media o valor esperado de G(X)
x

Sea

Ejemplo. Sea X una variable aleatoria discreta con distribucin de probabilidad: x f(x) 1 0.1 2 0.4 3 0.3 4 0.2 Sea G(X) = 2X + 1. Encuentre E[G(X)] Respuesta.

G(X)=E[G(X)] = G(x )f (x ) = (2(1)+1)(0.1) + (2(2)+1)(0.4) + (2(3)+1)(0.3) + (2(4)+1)(0.2) = 6.2


x =1

Ejemplo. Un almacn vende diariamente 0, 1, 2, 3, o 4 artculos con probabilidad 10%, 40%, 30%, 15%, y 5% respectivamente. Mantener el local le cuesta diariamente $40 a la empresa. Por cada artculo que vende, tiene una ganancia de $50. Encuentre el valor esperado de la ganancia diaria. Respuesta: Sea X: variable aleatoria discreta (nmero de artculos que vende cada da) La distribucin de probabilidad de X es: x f(x)=P(X=x) 0 0.1 1 0.4 2 0.3 3 0.15 4 0.05 Sea G(X) = 50X 40, variable aleatoria que representa la ganancia diaria Entonces E[G(X)]=
x =0

G(x)f(x) = (50(0)-40)(0.1) + (50(1)-40)(0.4) + .... = 42.5

75

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Significa que cada da la ganancia esperada es $42.5

Definicin: Juego justo


Se dice que un juego es justo si el valor esperado de la ganancia es cero.

Ejemplo. Un juego consiste en lanzar tres monedas. Si salen 1 o 2 sellos, se pierde $2. Cuanto se debe ganar en los otros casos para que sea un juego justo? Respuesta: Sea X: nmero de sellos (variable aleatoria discreta) f(x): distribucin de probabilidad de X G(X): ganancia (variable aleatoria) Se tiene la distribucin de probabilidad de X: x 0 1 2 3 f(x)=P(X=x) 1/8 3/8 3/8 1/8 G(x) k -2 -2 k

k es la cantidad que se debe ganar cuando salen 0 o 3 sellos. 3 Entonces E[G(X)] = G( x )f ( x ) = k(1/8) + (-2)(3/8) + (-2)(3/8) + k(1/8) = 0 x=0 Pues el valor esperado debe ser 0. De donde se obtiene k = 6 dlares.

4.3.2 PROPIEDADES DEL VALOR ESPERADO


Definicin: Propiedades del valor esperado Sean X: Variable aleatoria discreta Distribucin de probabilidad de X f(x): a, b : nmeros reales cualesquiera Entonces E(aX + b) = aE(X) + b Demostracin E(aX + b) = (ax + b)f(x) =
x

axf(x) + bf(x) = a xf(x) + b f(x)


x

Se tiene E(X) =

xf(x) , adems
x

f(x) = 1 , con lo que se completa la demostracin.


x

4.3.3 COROLARIOS
1)

E(aX) = a E(X),

2)

E(b)=b

El segundo corolario muestra que si el resultado de un experimento es una constante, el valor esperado debe ser tambin constante.

76

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. Calcule el valor esperado para el ejemplo del almacn usando la nueva frmula Respuesta: G(X) = 50X 40 E[G(X)] = E(50X 40) = 50 E(X) 40 4 E(X) = xf ( x ) = 0(0.1) + 1(0.4) + 2(0.3) + 3(0.15) + 4(0.05) = 1.65 x=0 E[G(X)] = 50(1.65) 40 = 42.5

4.4

VARIANZA DE UNA VARIABLE ALEATORIA DISCRETA

La varianza o variancia es una medida estadstica que cuantifica el nivel de dispersin de los valores de la variable aleatoria alrededor de la media. Es una medida de variabilidad.

Definicin: Varianza de una variable aleatoria X: variable aleatoria discreta f(x): distribucin de probabilidad , o E(X): valor esperado de la variable aleatoria X Entonces 2= V(X) = E[(X-)2] = (x )2 f(x) es la varianza de la variable aleatoria X
Sea
x

En la definicin de la varianza se suman las diferencias de cada valor x con respecto a la media ponderadas con los valores de probabilidad. Elevar al cuadrado puede interpretarse que es de inters la magnitud de las diferencias. El verdadero motivo pertenece a la teora estadstica.

Ejemplo. En el experimento de lanzar tres monedas, se defini la variable aleatoria X correspondiente al nmero de sellos. Calcule la varianza de esta variable aleatoria X. Respuesta: Se tiene la distribucin de probabilidad de X: x 0 1 2 3 f(x)=P(X=x) 1/8 3/8 3/8 1/8

Tambin se tiene el valor esperado de X: = E(X) =

x=0 Entonces, usando la definicin anterior la varianza de X es,

xf (x )

= 1.5

2= V(X) = E[(X-)2] =

x =0

(x )2 f(x) = (0-1.5)2(1/8) +(1-1.5)2(3/8) + . . .


+ (2-1.5)2(3/8)+(3-1.5)2(1/8) = 0.75

77

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

4.4.1 FRMULA ALTERNA PARA CALCULAR LA VARIANZA


La siguiente frmula es equivalente a la anterior. Es importante recordarla

Definicin: Frmula alterna para calcular la varianza

2 = V(X) = E[(X)2] = E(X2) 2


Demostracin. Usando las propiedades del valor esperado: V(X) = E[(X )2] = E(X2 2X + 2) = E(X2) E(2X) + E(2) = 2 2 2 2 = E(X2) 2E(X) + = E(X2) 2 + = E(X2) Ejemplo. Calcule la varianza en el ejemplo anterior usando la frmula alterna E(X2) = x 2 f(x) = 02(1/8) + 12(3/8) + 22(3/8) + 32(1/8) = 3
x =0 3

2= V(X) = E(X2) - 2 = 3 1.52 = 0.75

4.4.2 PROPIEDADES DE LA VARIANZA


Definicin: Propiedades de la varianza Sean X: Variable aleatoria discreta Distribucin de probabilidad de X f(x): a, b : nmeros reales cualesquiera Entonces V(aX + b) = a2V(X)

Demostracin Usando la frmula alterna de varianza y las propiedades del valor esperado: V(aX+b) = E[(aX + b)2] E2(aX +b) = E(a2X2 + 2abX + b2) [aE(X) + b]2 = a2E(X2) + 2abE(X) + b2 [a2E2(X) + 2abE(X) + b2] = a2[E(X2) E2(X)] = a2 V(X)

4.4.3 COROLARIOS
1)

V(aX) = a2 V(X)

2)

V(b)=0

El segundo corolario muestra que si el resultado de un experimento es un valor constante entonces la variabilidad es nula.

NOTA
La distribucin de probabilidad de una variable aleatoria incluye a los valores de probabilidad de todos los resultados que puede tomar la variable aleatoria, es decir su espacio muestral; mientras que una muestra incluye una parte de este espacio muestral

78

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

La media y varianza , , de una variable aleatoria son las medidas estadsticas referidas al espacio muestral, mientras que se usan X, S2 para referirse a las medidas estadsticas de la muestra.
2

EJERCICIOS
1) Sea X una variable aleatoria discreta y f su funcin de distribucin de probabilidad: 2x + 1 f(x) = , x = 0, 1, 2, 3, 4 25 a) Calcule la media de X b) Sea G(X) = 2X+1. Calcule la media de G(X) c) Calcule la varianza de X 2) Para ensamblar una mquina se usan dos componentes mecnicos. Suponga que la probabilidad que el primer componente cumpla las especificaciones es 0.95, y para el segundo es 0.98. Adems, los componentes funcionan independientemente. Usando funcin de distribucin de probabilidad de la variable aleatoria X que representa al nmero de componentes que cumplen las especificaciones, x = 0, 1, 2, obtenida en la unidad anterior. a) Encuentre la media y la varianza de la variable aleatoria X b) Suponga que el costo asociado con los componentes instalados que no cumplen las especificaciones es G(X)=$5000X2. Encuentre el valor esperado de este costo.

MATLAB
Clculo del valor esperado de una variable aleatoria discreta >> x = [1 2 3 4]; >> f = [0.1 0.4 0.3 0.2]; >> mu = sum(x.*f) mu = 2.6000 Valor esperado de una expresin >> g = 2*x+1; >> mug=sum(g .*f) mug = 6.2000
Una expresin con X: g(X) = 2x + 1 Media de g(X) Valores de la variable aleatoria X Distribucin de probabilidad de la variable X Media de X

Clculo de la varianza de una variable aleatoria discreta >> sigma2 = var(x, f) sigma2 = 0.8400

79

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

4.5

MOMENTOS DE UNA VARIABLE ALEATORIA DISCRETA

La media de una variable aleatoria discreta describe su tendencia central y la variancia mide su dispersin, pero estas medidas no son suficientes para describir completamente la forma de la distribucin de probabilidad. Los momentos de una variable aleatoria son los valores esperados de algunas funciones de la variable aleatoria. Constituyen una coleccin de medidas descriptivas con las que se puede caracterizar de manera nica a su distribucin de probabilidad. Usualmente estas definiciones se las hace usando como referencia el origen, o la media de la variable aleatoria.

4.5.1 MOMENTOS ALREDEDOR DEL ORIGEN


Definicin Sea X: Variable aleatoria discreta f(x): Distribucin de probabilidad de X Entonces, el r-simo momento de X alrededor del origen es: r = E(Xr) = xr f(x)
x

r=1: r=2: etc.

1 = E(X) = 2 = E(X2) =

xf(x) =
x

(Primer momento alrededor del origen. Es la media) (Segundo momento alrededor del origen)

x2 f(x)
x

4.5.2 MOMENTOS ALREDEDOR DE LA MEDIA


Definicin X: f(x): Entonces, Sea Variable aleatoria discreta Distribucin de probabilidad de X el r-simo momento de X alrededor de la media o r-simo momento central, es: r = E[(X)r ] = (x )r f(x)
x

r=1: r=2: r=3: r=4:

1 = E[(X-)] = E(X) = 0 2 2 = E[(X-)2] = 3 = E[(X-)3] 4 = E[(X-)4]

(Primer momento central) (Segundo momento central. Es la varianza) (Tercer momento central) (Cuarto momento central)

El segundo momento central o varianza, mide la dispersin El tercer momento central, mide la asimetra o sesgo El cuarto momento central, mide la curtosis o puntiagudez. Se definen coeficientes para expresar los momentos en forma adimensional para que no dependan de la escala de medicin y puedan usarse para comparar la distribucin entre variables aleatorias. Para los tres momentos centrales indicados arriba, son respectivamente:

4.5.3 COEFICIENTES
Definiciones Coeficiente de Variacin: Coeficiente de Asimetra: Coeficiente de Curtosis

/ 3/(2)3/2 4/(2)2

80

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

4.5.4 VALORES REFERENCIALES


Valores referenciales y significado de algunos coeficientes Coeficiente de asimetra Positivo: La distribucin tiene sesgo positivo (se extiende a la derecha) Cero: La distribucin es simtrica. Negativo: La distribucin tiene sesgo negativo (se extiende a la izquierda) Coeficiente de curtosis Mayor a 3: La distribucin es puntiaguda o leptocrtica Igual a 3: La distribucin es regular Menor a 3: La distribucin es plana o platicrtica

4.5.5 EQUIVALENCIAS ENTRE MOMENTOS


Los momentos centrales pueden expresarse mediante los momentos alrededor del origen usando la definicin de valor esperado: 2 = E[(X-)2] = E(X2) - 2 = 2 2 3 = E[(X-)3] = 3 - 32 + 23 4 = E[(X-)4] = 4 - 43 + 622 - 34 (Es la definicin de varianza)

4.6

FUNCIN GENERADORA DE MOMENTOS

Es una funcin especial que puede usarse para obtener todos los momentos de una variable aleatoria discreta Definicin X: Variable aleatoria discreta f(x): Distribucin de probabilidad de X Entonces la funcin generadora de momentos de X es: M(t) = E(etX) = Sea

etX f(x)

El fundamento matemtico de la funcin generadora de momentos se basa en la suposicin de que es factible el desarrollo de etX en serie de potencias: etX = 1 + tX + t2X2/2! + t3X3/3! + ... Con la definicin de valor esperado se obtiene: M(t) = E(etX) = E(1) + E(tX) + E(t2X2/2!) + E(t3X3/3!) + ... = 1 + t E(X) + t2/2! E(X2) + t3/3! E(X3) + ... = 1 + (t) 1 + (t2/2!) 2 + (t3/3!) 3 + ...

4.6.1 OBTENCIN DE MOMENTOS


El desarrollo anterior justifica el uso de la siguiente frmula como un dispositivo matemtico para obtener cualquier momento alrededor del origen, de una variable aleatoria discreta: Definicin

r =

dr M(t) |t=0 dtr

Aplicacin de la frmula

81

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

1) Primer momento alrededor del origen: d d d M(t)|t=0 = E[etX]|t=0 = E[ etX]|t=0 = E[XetX]t=0 = E(X) = 1 dt dt dt 2) Segundo momento alrededor del origen: d2 d2 d2 tX tX M(t)| = E[e ]| = E[ e ]|t=0 = E[X2 etX]t=0 = E(X2) = 2 t=0 t=0 dt 2 dt 2 dt 2 Ejemplo. Suponga una variable aleatoria discreta X con la siguiente distribucin de probabilidad: x f(x) 1 0.2 2 0.3 3 0.4 4 0.1 a) Encuentre el coeficiente de variacin = 1 = E(X) = xf(x) = 1(0.2) + 2(0.3) + 3(0.4) + 4(0.1) = 2.4
x =1 4

2 = E(X2) =

x =1

x2 f(x) = 12(0.2) + 22(0.3) + 32(0.4) + 42(0.1) = 6.6

2 = 2 = E[(X)2] =E(X2) 2 = 2 (1)2 = 6.6 (2.4)2 = 0.84 v = / = 0.84 /2.4 = 0.3819

b)

Encuentre el coeficiente de asimetra


3 = E(X3) =
x =1

x3 f(x) = 13(0.2) + 23(0.3) + 33(0.4) + 43(0.1) = 19.8


3/(2)3/2 = 0.072/(0.84)3/2 = 0.0935

3 = E[(X)3] = 3 32 + 23 = 19.8 3(2.4)(6.6) + 2(2.4)3 = 0.072 Coeficiente de asimetra:

Siendo este valor negativo, se concluye que la distribucin es asimtrica con sesgo hacia la izquierda.

c) Encuentre la funcin generadora de momentos M(t) = E(etX) =

e tx f(x) =
x

x =1

etx f(x) = 0.2et + 0.3e2t + 0.4e3t + 0.1e4t

d) Encuentre la media de la variable aleatoria usando la funcin generadora de momentos d d M(t)|t=0 = (0.2et + 0.3e2t + 0.4e3t + 0.1e4t)|t=0 dt dt = [0.2(et) + 0.3(2e2t) + 0.4(3e3t) + 0.1(4e4t)]|t=0 = 0.2(1) + 0.3(2) + 0.4(3) + 0.1(4) = 2.4

Con la funcin generadora de momentos se pueden obtener todos los momentos de la variable aleatoria. Los momentos son las medidas descriptivas de la variable aleatoria, con los cuales se puede caracterizar su funcin de probabilidad. Si la funcin generadora de momentos existe, entonces esta es nica. Por lo tanto permite describir completamente a la distribucin de probabilidad de una variable aleatoria. Una consecuencia de este argumento es la siguiente propiedad

82

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

4.6.2 PROPIEDAD DE UNICIDAD


Definicin: Unicidad de funciones de distribucin de probabilidad
Sean

X, Y f(x), f(y) MX(t), My(t)

Variables aleatorias discretas Distribuciones de probabilidad Funciones generadoras de momentos

Si MX(t) = My(t) para el mismo dominio de t, entonces las variables aleatorias X, Y tienen idntica distribucin de probabilidad, es decir f(x) = f(y)

4.7

TEOREMA DE CHEBYSHEV

Este teorema establece un valor mnimo para la probabilidad de una variable aleatoria en un intervalo alrededor de la media, independientemente de su funcin de probabilidad. El valor que se obtiene es nicamente una referencia.

Definicin: Teorema de Chebyshev


Sea X una variable aleatoria discreta con media y varianza , entonces, la probabilidad que X tome un valor dentro de k desviaciones estndar de su media , es al menos 1 1/k2:
2

P( k < x < k) 1 1/k2 , k+, k1


Demostracin Esta demostracin usa una variable aleatoria discreta, pero tambin se puede demostrar para una variable aleatoria continua.
Separamos el dominio de la variable aleatoria X en tres regiones R1, R2, R3:

X k 2 = E[(X-)2] = +k
2

Con la definicin de varianza:

(x )
x R2

f(x)
2 2

= ( x )2 f(x) + >
2

(x )
R1

R1

(x ) f(x) + (x ) f(x) f(x) + ( x ) f(x), se suprime un trmino positivo


R3 2 R3

En R1: x k x k (x) k (x) k


2

2 2

En R3: x +k x k

(x)2 k22

Al sustituir en las sumatorias, se mantiene la desigualdad:

2 >

k
2 R1 R1

f(x) +

k
2 R3

f(x),

De donde se obtiene simplificando,

1/k2 >

f (x ) + f (x ) ,
R3

Las sumas son valores de probabilidad

1/k2 > P(X k X +k), 83

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Tomando el complemento de probabilidad:

1 1/k2 P(k < X < +k)


Esto completa la demostracin

Ejemplo. La produccin diaria de una fbrica es una variable aleatoria discreta con media 120 artculos, y desviacin estndar de 10 artculos. Calcule la probabilidad que en cualquier da la produccin est entre 95 y 145 artculos. Respuesta
95 k Por lo tanto, 120 145 +k

k = 25 k(10) = 25 k = 2.5

P(95 < X < 145) 1 1/2.52 P(95 < X < 145) 0.84

EJERCICIOS
1) Suponga una variable aleatoria discreta X con la siguiente distribucin de probabilidad: x f(x) 1 0.10 2 0.20 3 0.50 4 0.15 5 0.05 a) b) c) d) e)
Encuentre el coeficiente de variacin Encuentre el coeficiente de asimetra e interprete el resultado Encuentre el coeficiente de curtosis e interprete el resultado Encuentre la funcin generadora de momentos Encuentre la media de la variable aleatoria usando la funcin generadora de momentos

2) Encuentre el menor valor de k en el teorema de Chebyshev para el cual la probabilidad de que una variable aleatoria tome un valor entre k y + k sea a) cuando menos 0.95 b) cuando menos 0.99

84

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
>> x = [1 2 3 4]; Valores de la variable aleatoria X Distribucin de probabilidad de la variable X >> f = [0.2 0.3 0.4 0.1]; >> mu=sum(x.*f) Media mu = 2.4000 Varianza >> mu2=sum((x-mu).^2.*f) mu2 = 0.8400 Asimetra >> mu3=sum((x-mu).^3.*f) mu3 = -0.0720 Curtosis >> mu4=sum((x-mu).^4.*f) mu4 = 1.4832 >> syms t Funcin generadora de momentos >> fgm=sum(exp(x*t).*f) fgm = 1/5*exp(t)+3/10*exp(2*t)+2/5*exp(3*t)+1/10*exp(4*t) >> t=0; >> mu=eval(diff(fgm)) Media usando la funcin generadora de momentos mu = 2.4000

85

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

DISTRIBUCIONES DE PROBABILIDAD DISCRETAS

En este captulo se estudian los modelos matemticos para calcular la probabilidad en algunos problemas tpicos en los que intervienen variables aleatorias discretas. El objetivo es obtener una frmula matemtica f(x) para determinar los valores de probabilidad de la variable aleatoria X.

5.1

DISTRIBUCIN DISCRETA UNIFORME

Una variable aleatoria tiene distribucin discreta uniforme si su espacio muestral tiene n resultados, y cada uno con igual probabilidad. Definicin: Distribucin discreta uniforme Sean X: Variable aleatoria discreta x = x1, x2, x3, ..., xn los valores que puede tomar, con igual probabilidad Entonces la distribucin de probabilidad de X es: 1 , x = x1 ,x 2 ,...,xn f(x) = n . 0, otro x

Ejemplo. Un experimento consiste en lanzar un dado y observar el resultado. Si X es la variable aleatoria correspondiente a los resultados posibles, entonces su distribucin de probabilidad tiene distribucin discreta uniforme:
1/ 6, x=1, 2, . . . , 6 P(X = x) = f(x) = 0, para otro x

5.1.1 MEDIA Y VARIANZA DE LA DISTRIBUCIN DISCRETA UNIFORME


Se obtienen directamente de las definiciones correspondientes Definicin: Sea X: variable aleatoria con distribucin discreta uniforme n 1 n Media: = E[X] = xf(x) = xi f(xi ) = xi n i=1 x i=1 Varianza:

2 = E[(X )2] = (xi )2 f(x) =


x

1 n (xi )2 n i =1

Ejemplo. Un almacn vende diariamente 0, 1, 2, 3, o 4 artculos con igual probabilidad. Calcule la probabilidad que en algn da venda al menos 2 artculos Respuesta Sean X: cantidad de artculos que vende cada da (variable aleatoria discreta) x = 0, 1, 2, 3, 4 X tiene distribucin uniforme con p = 1/5 P(X = x ) = f(x) = 0.2, x = 0, 1, 2, 3, 4 P(X2) = f(2) + f(3) + f(4) = 3(0.2) = 0.6

86

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

5.2

DISTRIBUCIN DE BERNOULLI

Es un experimento estadstico en el que pueden haber nicamente dos resultados posibles. Es costumbre designarlos como xito y fracaso aunque pueden tener otra representacin y estar asociados a algn otro significado de inters. Si la probabilidad de obtener xito en cada ensayo es un valor que lo representamos con p, entonces, la probabilidad de obtener fracaso ser el complemento q = 1 p.

Definicin: Distribucin de Bernoulli

X: Variable aleatoria cuyos valores pueden ser 1: xito, 0: fracaso p: Valor de probabilidad de que el resultado del ensayo sea xito Entonces, la distribucin de probabilidad de X es
Sean
x=1 p, f(x) = 1 p, x = 0

El experimento puede repetirse y en cada ensayo el valor de probabilidad p debe mantenerse constante. Se supondr tambin que los ensayos son independientes, es decir el resultado de un ensayo no afecta a los resultados de los otros ensayos Suponer que se obtienen los siguientes resultados: 1 1 0 0 1 0 ..., en donde 1 es exito, 0 es fracaso Sean p probabilidad que el resultado sea xito q=1p probabilidad que el resultado sea fracaso Entonces la probabilidad de obtener esta secuencia de resultados es: P(X=1,X=1,X=0,X=0,X=1,X=0, ...) = f(1) f(1) f(0 f(0) f(1) f(0) ... = pp(1-p)(1-p)pq...

Ejemplo. Suponer que la probabilidad de xito de un experimento es 0.2 y se realizan cinco ensayos. Calcule la probabilidad que el primero y el ltimo ensayo sean xitos, y los tres restantes sean fracasos. Suponer que los ensayos son independientes.
1: el ensayo es xito 0: el ensayo es fracaso Entonces P(X=1,X=0,X=0,X=0,X=1) = f(1)f(0)f(0)f(0)f(1) = (0.2)(0.8)(0.8)(0.8)(0.2) = 0.0205 = 2.05% Sean

5.3

DISTRIBUCIN BINOMIAL

Esta es una distribucin importante y de uso frecuente. Corresponde a experimentos con caractersticas similares a un experimento de Bernoulli, pero ahora es de inters la variable aleatoria relacionada con la cantidad de xitos que se obtienen en el experimento.

a) b) c) d)

Caractersticas de un experimento binomial La cantidad de ensayos que se realizan es finita. Sea esta cantidad n Cada ensayo tiene nicamente dos resultados posibles: xito o fracaso Todos los ensayos realizados son independientes La probabilidad de xito en cada ensayo permanece constante. Sea este valor p.

Algunos ejemplos de problemas con estas caractersticas 1) Analizar la probabilidad respecto a la cantidad de artculos que son defectuosos en una muestra tomada al azar de la produccin de una fbrica, suponiendo conocida la probabilidad de que un artculo sea defectuoso 2) Analizar la probabilidad de la cantidad de personas que estn a favor de un candidato, en un grupo de personas elegidas al azar de una poblacin grande. Suponiendo conocida la probabilidad de que una persona est a favor del candidato. Definicin: Distribucin binomial

87

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Sean

X: Variable aleatoria discreta cuyo valor representa la cantidad de ensayos


considerados xitos en una serie de n ensayos realizados.

x = 0, 1, 2, ..., n valores que puede tomar X p: valor de probabilidad de que cada resultado sea xito Entonces, la distribucin de probabilidad de X es n f(x) = p x (1 p)n x , x = 0, 1, 2, ..., n x

Demostracin En los n ensayos se han producido x xitos y n - x fracasos, por lo tanto siendo ensayos x n-x independientes la probabilidad de obtener estos resultados es p (1-p) n Pero, en los n ensayos realizados hay formas diferentes de obtener los x xitos y los x

n - x fracasos. Este nmero es entonces un factor para el valor de probabilidad anterior.


n El smbolo o nCx representan el nmero de combinaciones o arreglos diferentes que se x obtienen con n elementos, tomando un grupo de x elementos.

Ejemplo. Se realizan 8 lanzamientos de un dado. Calcule la probabilidad de obtener 4 veces el nmero 6. Respuesta. Este experimento tiene las caractersticas de un experimento binomial con: n = 8: Cantidad de ensayos (independientes) p = 1/6 Probabilidad que cada ensayo sea xito (sale el 6) X: Variable aleatoria discreta (cantidad de veces que sale el 6) x = 0, 1, 2, ..., 8 Valores que puede tomar X
Por lo tanto, el modelo con los datos para este problema es: n 8 P(X=x) = f(x) = p x (1 p)n x = (1/6)x (5/6)8-x , x = 0, 1, 2, ..., 8 x x De donde se obtiene 8 P(X=4) = f(4) = (1/6)4 (5/6)8-4 = (70) (1/6)4 (5/6)4 = 0.026 = 2.6% 4

Ejemplo Una fbrica tiene una norma de control de calidad consistente en elegir al azar diariamente 20 artculos producidos y determinar el nmero de unidades defectuosas. Si hay dos o ms artculos defectuosos la fabricacin se detiene para inspeccin de los equipos. Se conoce por experiencia que la probabilidad de que un artculo producido sea defectuoso es 5%. Encuentre la probabilidad de que en cualquier da la produccin se detenga al aplicar este norma de control de calidad. Respuesta Esta situacin corresponde a un experimento binomial n = 20 Cantidad de ensayos (independientes) p = 0.05 Probabilidad de xito (constante) X: Variable aleatoria discreta (cantidad de artculos defectuosos) x = 0, 1, ..., 20 Valores que puede tomar X n 20 P(X=x) = f(x) = p x (1 p)n x = 0.05 x (0.95)20 x , x = 0,1,2, ...,20 x x

88

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Entonces P(X2) = 1 P(X1) = 1 (P(X=0) + P(X=1)) = 1 (f(0) + f(1)) 20 f(0) = 0.05 0 (0.95)20 = 0.3585 0
20 f(1) = 0.051 (0.95)19 = 0.3774 1 P(X2) = 1 0.3585 0.3774 = 0.2641 = 26.41%

(conviene usar esta propiedad)

5.3.1 PARMETROS Y VARIABLE


Los parmetros de un modelo de distribucin de probabilidad se refieren a los valores que pertenecen a un problema particular. Para la distribucin binomial los parmetros son n y p. Una vez que est definido el problema, se puede calcular la probabilidad correspondiente a cualquiera de los valores que puede tomar la variable aleatoria X. Se puede usar la siguiente notacin para distinguir entre variable y parmetros:

n f(x; n, p) = p x (1 p)n x , x = 0, 1, 2, ..., n x


Variable Parmetros

En el ejemplo anterior, el modelo de distribucin de probabilidad se puede escribir: 20 f(x; 20, 0.05) = 0.05 x (0.95)20 x , x = 0, 1, . . ., 20 x

5.3.2 DISTRIBUCIN DE PROBABILIDAD ACUMULADA


Definicin
Sea

X: Variable aleatoria discreta con distribucin binomial con parmetros n, p

Entonces, la distribucin de probabilidad acumulada F de X es n F(x) = P(X x) = pt (1 p)n t , x 0 t x t

89

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

5.3.3 GRAFICO DE LA DISTRIBUCIN BINOMIAL


La distribucin binomial tiene su grfico con forma simtrica cuando p=0.5

Ejemplo. Grafique la distribucin binomial con n=10, p=0.5 10 10 f(x) = (0.5)x (0.5)10 x = (0.5)10 , x = 0,1,...,10 x x f(0) = 0.0010 f(1) = 0.0098 f(2) = 0.0439 ... f(8) = 0.0439 f(9) = 0.0098 f(10) = 0.0010

Fig. Distribucin binomial con p=0.5

Si p>0.5, la forma de la distribucin binomial tiene sesgo negativo. Si p<0.5, la forma de la distribucin binomial tiene sesgo positivo.

Ejemplo Grafique la distribucin binomial con n=10, p=0.65 10 f(x) = (0.65)x (0.35)10 x ,x = 0,1,...,10 x f(0) = 0.0000 f(1) = 0.0005 ... f(9) = 0.0725 f(10) = 0.0135

Fig. Distribucin binomial con p>0.5

90

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

5.3.4 MEDIA Y VARIANZA DE LA DISTRIBUCIN BINOMIAL


Definicin:
Sea X: variable aleatoria discreta con distribucin binomial con parmetros n, p Entonces = E(X) = np Media de X 2 = V(X) = np(1-p) Varianza de X

Demostracin Esta demostracin usa la definicin de funcin generadora de momentos para variables aleatorias discretas
Distribucin de probabilidad de la distribucin binomial: n f(x) = p x qn x , x = 0, 1, ..., n, siendo q = 1 - p x Los trminos de la distribucin binomial coinciden con el desarrollo del binomio: (q + p) n n n n n (q + p)n = p0 qn + p1qn1 + ... + pnq0 = p x qn x 0 1 n x =0 x La funcin generadora de momentos para la distribucin binomial: n n n n n m(t) = E(etX) = e tx f(x) = e tx p x qn x = (e tp)x qn x x x=0 x=0 x=0 x Luego de la simplificacin algebraica se puede observar que la ltima expresin tiene la misma t forma que la frmula del binomio sustituyendo p por e p. Entonces se tiene
n

Definicin: Funcin generadora de momentos de la distribucin binomial

m(t) = (q + etp)n
Con la definicin correspondiente se pueden obtener los momentos alrededor del origen:

d d t m(t) | t = 0 = (e p + q)n | t = 0 = n(e tp + q)n1 e tp |t = 0 = n(p + q)n1p , dt dt Pero p + q = 1, entonces: = np. Esto completa la demostracin. = '1 =
La demostracin de la varianza sigue un camino similar. Primero debe encontrar 2 con la definicin:

'2 =

d2 m( t )|t = 0 , y despus use la definicin: 2 = V(X) = E(X2) 2 = 2 2 dt 2

Ejemplo. Encuentre la media y la varianza para el ejemplo del control de calidad en la fbrica. Respuesta: = np = 10 (0.1) = 1 2 = npq = 10(0.1)(0.9) = 0.9 representa la cantidad promedio de artculos defectuosos que se obtienen cada da 2 es una medida de la variabilidad o dispersin de los valores de X

91

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) La variable aleatoria X tiene distribucin discreta uniforme para x=1, 2, 3, . . . , 50 a) Determine la media y varianza de X b) Calcule P(5<X10) c) Calcule la media y varianza de la variable aleatoria Y=5X 2) La variable aleatoria X tiene distribucin binomial con n=8, p=0.4. a) Defina la funcin de distribucin de probabilidad de X b) Grafique la funcin de distribucin de probabilidad c) Grafique la funcin de distribucin de probabilidad acumulada d) Cual(es) el(los) valor(es) mas factible(s)s que ocurra(n) e) Cuales son los valores menos factibles de X f) Calcule P(X=5) g) Calcule P(X2) 3) Un ingeniero que labora en el departamento de control de calidad de una empresa elctrica, inspecciona una muestra al azar de tres motores de la produccin. Se sabe que 15% de los motores salen defectuosos. Calcule la probabilidad que en la muestra a) ninguno sea defectuoso, b) uno sea defectuosos, c) al menos dos sean defectuosos? d) Obtenga la media y la varianza de la variable aleatoria del problema 4) La probabilidad de que disco compacto dure al menos un ao sin que falle es de 0.95. Calcule la probabilidad de que en 15 de estos aparatos elegidos al azar, a) 12 duren menos de un ao, b) a lo ms 5 duren menos de un ao, c) al menos 2 duren menos de un ao. d) Obtenga la media y la varianza de la variable aleatoria del problema 5) Un examen de opciones mltiples tiene 20 preguntas y cada pregunta tiene cuatro posibles respuestas entre las cuales se debe elegir la correcta. Un estudiante decide usar una moneda para contestar el examen de la siguiente manera: Para cada pregunta lanza dos veces la moneda. Si el resultado es (cara, cara) marca la primera opcin Si el resultado es (cara, sello) marca la segunda opcin Si el resultado es (sello cara) marca la tercera opcin Si el resultado es (sello, sello) marca la cuarta opcin Para aprobar el examen se necesita marcar al menos 60% de las respuestas correctas. Calcule la probabilidad que este estudiante (?) apruebe el examen

92

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Probabilidad con la distribucin binomial >> f = binopdf(0, 20, 0.05) f= 0.3585 >> f = binopdf(1, 20, 0.05) f= 0.3774 >> f = binocdf(3, 10, 0.2) f= 0.8791
Probabilidad con la distribucin binomial: x=0, n=20, p=0.05

Probabilidad con la distribucin binomial: x=1, n=20, p=0.05

Probabilidad con la distribucin binomial acumulada P(X3), n = 10, p = 0.2

Valores para evaluar la distribucin binomial, x=0, 1, 2, . . ., 10 >> x = 0:10; >> f = binopdf(x, 10, 0.65) Distribucin binomial, x=0, 1, 2, . . ., 10; n=10, p=0.65 f= 0.0000 0.0005 0.0043 0.0212 0.0689 0.1536 0.2377 0.2522 0.1757 0.0725 0.0135

>> bar(f, 1, 'b'), grid on

Grfico de la distribucin de probabilidad en color azul

>> f = binocdf(x, 10, 0.65); Distribucin binomial acumulada, x=0, 1, 2, . . ., 10 f= n=10, p=0.65 0.0000 0.0005 0.0048 0.0260 0.0949 0.2485 0.4862 0.7384 0.9140 0.9865 1.0000 >> plot(x, f, 'ob') >> hold on >> plot(x,f,k), grid on
Grfico de los puntos de la distribucin acumulada, en azul Grfico superpuesto de la distribucin acumulada, en negro

93

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

5.4

DISTRIBUCIN BINOMIAL NEGATIVA

Los experimentos estadsticos con este modelo de probabilidad tienen caractersticas similares a los experimentos binomiales: los ensayos son independientes, cada ensayo tiene nicamente dos resultados posibles, y la probabilidad que cada ensayo tenga un resultado favorable es constante. La diferencia es que en este nuevo modelo la variable de inters se refiere a la cantidad de ensayos que se realizan hasta obtener una cantidad requerida de xitos: k Definicin: Distribucin binomial negativa Sea

X: Variable aleatoria discreta con distribucin binomial negativa

(cantidad de ensayos realizados hasta obtener k xitos) p: Probabilidad de xito. Es un valor constante en cada ensayo x = k, k+1, k+2, ... (valores que puede tomar la variable X) Entonces la distribucin de probabilidad de X es: x 1 k x-k P(X=x) = f(x) = k 1 p (1p) , x = k, k+1, k+2, . . . Demostracin Cada xito ocurre con probabilidad p y cada fracaso con probabilidad 1p. En algn ensayo x se tendrn finalmente k xitos, por lo tanto siendo ensayos independientes k x-k la probabilidad de obtener los k xitos y los xk fracasos es el producto: p (1p) Pero, antes de obtener el k-simo xito se realizaron x1 ensayos en los que se obtuvieron x 1 los previos k 1 xitos. Esto puede ocurrir en formas diferentes, por lo que este k 1 nmero es un factor para la frmula. Esto se completa la demostracin Est claro que la cantidad de ensayos que deben realizarse es al menos k.

Ejemplo Suponiendo que la probabilidad de que una persona contraiga cierta enfermedad a la que est expuesta es 30%, calcule la probabilidad que la dcima persona expuesta a la enfermedad sea la cuarta en contraerla. Respuesta Cada persona expuesta a la enfermedad constituye un ensayo. Estos ensayos son independientes y la probabilidad de xito es constante: 0.3. (Note que xito no siempre tiene una connotacin favorable) Por la pregunta concluimos que la variable de inters X tiene distribucin binomial negativa con k=4, p=0.3. Sean X: Cantidad de ensayos realizados hasta obtener k xitos (variable aleatoria discreta) x = 4, 5, 6, . . . x 1 4 x-4 P(X=x) = f(x) = 0.3 (1 0.3) , x=4, 5, 6, ... 4 1 Por lo tanto 10 1 4 10-4 = 0.08 P(X=10) = f(10) = 0.3 0.7 4 1

94

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

5.4.1 MEDIA Y VARIANZA DE LA DISTRIBUCIN BINOMIAL NEGATIVA


Definicin: Media: = E[X] =

k , p

Varianza:

2 = V[X] =

k 1 ( 1) p p

5.5

DISTRIBUCIN GEOMTRICA

Es un caso especial de la distribucin binomial negativa, cuando k=1. Es decir interesa conocer la probabilidad respecto a la cantidad de ensayos que se realizan hasta obtener el primer xito Definicin: Distribucin geomtrica Sean X: Variable aleatoria discreta con distribucin geomtrica (cantidad de ensayos realizados hasta obtener el primer xito) x = 1, 2, 3, ... (valores factibles para la variable X) p: probabilidad de xito (constante) en cada ensayo Entonces la distribucin de probabilidad de X es:

P(X=x) = f(x) = p(1-p)x-1 , x=1, 2, 3, ...


Demostracin Se obtiene directamente haciendo k=1 en el modelo de la distribucin binomial negativa.

5.5.1 MEDIA Y VARIANZA DE LA DISTRIBUCIN GEOMTRICA


Definicin: Media: = E[X] =

1 , p

Varianza: = V[X] =
2

1 1 ( 1) p p

Ejemplo. Calcule la probabilidad que en el quinto lanzamiento de tres monedas se obtengan tres sellos por primera vez. Respuesta: En el experimento de lanzar tres monedas hay 8 resultados posibles. En cada ensayo la probabilidad que salgan tres sellos es constante e igual a 1/8 y la probabilidad que no salgan tres sellos es 7/8. Estos ensayos son independientes, y por la pregunta concluimos que la variable de inters X tiene distribucin geomtrica con p=1/8, Sea X: Cantidad de ensayos hasta obtener el primer xito (variable aleatoria discreta) x = 1, 2, 3, . . . x-1 P(X=x) = f(x) = (1/8)(7/8) , x=1, 2, 3, ... Por lo tanto 5-1 P(X=5) = f(5) = (1/8)(7/8) = 0.0733

95

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

5.6

DISTRIBUCIN HIPERGEOMTRICA

Esta distribucin se refiere a los experimentos estadsticos que consisten en tomar una muestra sin reemplazo, de un conjunto finito el cual contiene algunos elementos considerados xitos y los restantes son considerados fracasos. Tomar una muestra sin reemplazo significa que los elementos son tomados uno a uno, sin devolverlos. Podemos concluir entonces que los ensayos ya no pueden ser considerados independientes porque la probabilidad de xito al tomar cada nuevo elemento es afectada por el resultado de los ensayos anteriores debido a que la cantidad de elementos de la poblacin est cambiando. Definicin: Distribucin hipergeomtrica Sean

N: Cantidad de elementos del conjunto del que se toma la muestra K: Cantidad de elementos existentes que se consideran xitos n: Tamao de la muestra X: Variable aleatoria discreta (es la cantidad de resultados considerados xitos x = 0, 1, 2, ..., n
que se obtienen en la muestra) (son los valores que puede tomar X)

Entonces, la distribucin de probabilidad de X es

K N K x n x , x = 0,1,2,..., n f(x) = N n
Demostracin

N K
xitos en la muestra

muestra

n x

NK nx
fracasos

xitos

fracasos en la muestra

Con referencia al grfico: K es la cantidad total de formas de tomar x xitos en la muestra de los K existentes x

N K es la cantidad total de formas de tomar n x fracasos de los N K existentes. n x K N K es la cantidad total de formas de tomar x xitos y nx fracasos en la muestra x n x N .cantidad total de formas de tomar la muestra de n elementos del conjunto de N elementos n
Finalmente, mediante la asignacin clsica de probabilidad a eventos obtenemos la frmula para la distribucin hipergeomtrica. Esto completa la demostracin

96

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Observe que x no puede exceder a K. La cantidad de xitos que se obtienen en la muestra no puede exceder a la cantidad de xitos disponibles en el conjunto. Igualmente, la cantidad de n - x fracasos no puede exceder a los N - K disponibles. Ejemplo. Una caja contiene 9 bateras de las cuales 4 estn en buen estado y las restantes defectuosas. Se toma una muestra eligiendo al azar tres bateras. Calcule la probabilidad que en la muestra se obtengan, a) Ninguna batera en buen estado b) Al menos una batera en buen estado c) No mas de dos bateras en buen estado Respuesta. Este es un experimento de muestreo sin reemplazo, por lo tanto es un experimento hipergeomtrico con N=9 (Total de elementos del conjunto) K=4 (Total de elementos considerados xitos) n=3 (Tamao de la muestra) X: Cantidad de bateras en buen estado en la muestra (Variable aleatoria discreta) Entonces la distribucin de probabilidad de X es: 49 4 x 3 x f(x) = , x = 0,1,2,3 9 3
49 4 0 3 0 =0.119 a) P(X=0) = f(0) = 9 3

b) P(X1) = 1 P(X<1) = 1 f(0) = 1 - 0.119 = 0.881 c) P(X2) = P(X=0) + P(X=1) + P(X=2) = f(0) + f(1) + f(2) 49 4 49 4 49 4 0 3 0 1 3 1 2 3 2 + + = 0.119 + 0.4762 + 0.3571 = 0.9523 = 9 9 9 3 3 3 Tambin se puede calcular c) considerando que P(X2) = 1 P(X>2) = 1 f(3)

6.6.1 MEDIA Y VARIANZA DE LA DISTRIBUCIN HIPERGEOMTRICA


Definicin Media:

= E[X] = n

K , N

Varianza: = V[X] =
2

nK K Nn (1 )( ) N N N1

Las demostraciones se las puede encontrar en textos de Estadstica Matemtica. En el desarrollo se usa la definicin de valor esperado y las propiedades de las sumatorias. Ejemplo. Calcule la media y la varianza para el ejemplo anterior Respuesta: = 3(4/9) = 1.333 2 =

(es la cantidad promedio de bateras en buen estado que se obtienen al tomar muestras)

3(4) 4 93 (1 )( ) = 0.555 9 9 91

97

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

5.7

APROXIMACIN DE LA DISTRIBUCIN HIPERGEOMTRICA CON LA DISTRIBUCIN BINOMIAL

Si el tamao de la muestra n es muy pequeo respecto a N, entonces se puede aceptar que la probabilidad de xito en cada ensayo no cambia significativamente, es decir podemos considerar que los ensayos son aproximadamente independientes. Por ejemplo, si N=1000 y n=10, y hay 200 elementos considerados xitos, entonces, la probabilidad de xito del primer ensayo ser 200/1000=0.2, la probabilidad de xito del segundo ensayo podr ser 199/999=0.1992 o 200/999=0.2002, dependiendo si el primer resultado fue o no xito. Ambos valores son muy parecidos. En esta situacin, se puede considerar que el modelo hipergeomtrico es aproximadamente binomial y se puede usar la frmula de la distribucin binomial con p=K/N La bibliografa estadstica establece que esta aproximacin es aceptable si n < 5% de N. Sea h: distribucin hipergeomtrica b: distribucin binomial Si n<5%N, entonces h(x; N, K, n) b(x; n, K/N)

EJERCICIOS
1) La probabilidad que una persona expuesta a cierta enfermedad la contraiga es 0.3. Calcule la probabilidad que la quinta persona expuesta a esta enfermedad sea la segunda en contraerla. 2) Suponga que en dos de cada diez intentos, un vendedor realiza una venta. Calcule la probabilidad que en el sexto intento realice la primera venta. 3) Suponga que la probabilidad de tener un hijo varn o mujer son iguales a 0.5. Calcule la probabilidad que en una familia a) El cuarto hijo sea el primer varn b) El tercer hijo sea la segunda mujer c) El quinto hijo sea el tercer varn o sea la cuarta mujer 4) Un caja de 10 alarmas contra robo contiene 4 defectuosas. Si se seleccionan al azar 3 de ellas y se envan a un cliente, calcule la probabilidad que el cliente reciba a) Ninguna defectuosa; b) No ms de una defectuosa; c) Al menos una defectuosa 5) La probabilidad de que un estudiante para conductor apruebe el examen para obtener su licencia de conducir es 0.8, encuentre la probabilidad de que una persona apruebe el examen a) En el segundo intento., b) En el tercer intento.

98

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Distribucin binomial negativa >> f =nbinpdf(6, 4, 0.3) f= 0.0800 >> f=nbincdf(6, 4, 0.3) f= 0.3504 >> x = 0:40; >> f = nbinpdf(x, 4, 0.3) f = 0.0081 0.0583 0.0073 0.0004 0.0227 0.0510 0.0058 0.0003 0.0397 0.0439 0.0045 0.0003 Probabilidad con la distrib. binomial negativa: x=6, k=4, p=0.3 x es el nmero de fracasos hasta obtener k xitos

Probabilidad con la distrib. binomial negativa acumulada P(x6), k=4, p=0.3, x = 0, 1, 2, ..., 6

x=0, 1, 2, ..., 40 Distribucin binomial negativa: k=4, p=0.3, x=0, 1, 2, ..., 40 0.0556 0.0374 0.0036 0.0002 0.0681 0.0314 0.0028 0.0001 0.0762 0.0261 0.0022 0.0001 0.0800 0.0215 0.0017 0.0001 0.0800 0.0770 0.0719 0.0654 0.0175 0.0142 0.0114 0.0092 0.0013 0.0010 0.0008 0.0006 0.0001

>> bar(f, 1, 'b'), grid on

Grfico de la distribucin binomial negativa, color azul

Distribucin geomtrica >> f = geopdf(4, 1/8) f= 0.0733 >> x = 0:40; >> f = geopdf(x, 1/8) f = 0.1250 0.0288 0.0066 0.0015 0.1094 0.0252 0.0058 0.0013 0.0957 0.0220 0.0051 0.0012 Probabilidad con la distribucin geomtrica: x=4, p=1/8 x es el nmero de fracasos hasta obtener el primer xito

x=0, 1, 2, ..., 40 Distribucin geomtrica: p=1/8, x=0, 1, 2, ..., 40 0.0837 0.0193 0.0044 0.0010 0.0733 0.0169 0.0039 0.0009 0.0641 0.0148 0.0034 0.0008 0.0561 0.0129 0.0030 0.0007 0.0491 0.0430 0.0376 0.0329 0.0113 0.0099 0.0087 0.0076 0.0026 0.0023 0.0020 0.0017 0.0006

99

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

>> bar(f,1,'b'), grid on

Grfico de la distribucin geomtrica, en color azul

Distribucin hipergeomtrica >> f = hygepdf(0, 9, 4, 3) Distribucin hipergeomtrica x=0, N=9, K=4, n=3 f= Clculo de P(X = 0) 0.1190 >> f = hygecdf(2, 9, 4, 3) Distribucin hipergeomtrica acumulada f= P(X2), N=9, K=4, n=3, x=0, 1, 2 0.9524 >> [mu, var]=hygestat(9, 4, 3) Media y varianza de la distr. hipergeomtrica: N=9, K=4, n=3 mu = 1.3333 var = 0.5556 >> x = 0:10; >> f = hygepdf(x, 75, 20, 10) f = 0.0353 0.1534 0.2791 0.2791 0.1694 0.0651 0.0159 0.0025 0.0002 0.0000 0.0000 >> bar(f, 1, 'b'),grid on Grfico de la distribucin hipergeomtrica, en color azul

>> f = hygepdf(6, 1000, 200, 10) f= 0.0053 >> f = binopdf(6, 10, 200/1000) f= 0.0055

Distrib. hipergeomtrica x=6, N=1000, K=200, n=10

Distribucin binomial

x=6, n=10, p=K/N

Los resultados son cercanos pues n < 5%N

100

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

5.8

DISTRIBUCIN DE POISSON

La distribucin de Poisson es un modelo que puede usarse para calcular la probabilidad correspondiente al nmero de xitos que ocurren en una regin o en intervalo de tiempo especificados, si se conoce el nmero promedio de xitos que ocurren. Este modelo requiere que se cumplan las siguientes suposiciones: a) El nmero de xitos que ocurren en la regin o intervalo es independiente de lo que ocurre en otra regin o intervalo b) La probabilidad de que un resultado ocurra en una regin o intervalo muy pequeo, es igual para todos los intervalos o regiones de igual tamao y es proporcional al tamao de la regin o intervalo. c) La probabilidad de que ms de un resultado ocurra en una regin o intervalo muy pequeo no es significativa. Algunas situaciones que se pueden analizar con este modelo: Nmero de defectos por unidad de rea en piezas similares de un material. Nmero de personas que llegan a una estacin en un intervalo de tiempo especificado. Nmero de errores de transmisin de datos en un intervalo de tiempo dado. Nmero de llamadas telefnicas que entran a una central por minuto. Nmero de accidentes automovilsticos producidos en una interseccin, en una semana. Definicin: Distribucin de Poisson Sea

X: Variable aleatoria discreta con distribucin de Poisson


(cantidad de xitos en una regin o intervalo especificados)

x = 0, 1, 2, . . . (valores posibles para la variable X) : Cantidad promedio de xitos en la regin o intervalo especificados Entonces la distribucin de probabilidad de X es: xe f(x) = , x=0, 1, 2, ...., e = 2.71828... x!

Ejemplo. La cantidad de errores de transmisin de datos en una hora es 5 en promedio. Suponiendo que tiene distribucin de Poisson, determine la probabilidad que: a) En cualquier hora ocurra solamente 1 error. b) En cualquier hora ocurran al menos 3 errores c) En dos horas cualesquiera ocurran no ms de 2 errores. Respuesta: Sea X: Variable aleatoria discreta (cantidad de errores por hora) = 5 (promedio de errores de transmisin en 1 hora) 51 e 5 a) P(X=1) = f(1) = = 0.0337 1! b) P(X3) = 1 P(X2) = 1 (f(0) + f(1) + f(2)) = 1 0.1247 = 0.8743 c) Sea X: variable aleatoria discreta (cantidad de errores en 2 horas) = 10 (promedio de errores de transmisin en dos horas) 100 e 10 101 e 10 102 e 10 P(X2) = f(0) + f(1) + f(2) = + + = 0.0028 0! 1! 2!

101

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

5.8.1 MEDIA Y VARIANZA DE LA DISTRIBUCIN DE POISSON


Definicin Media:

= E[X] = ,

Varianza:

V[X] =

Demostracin Primero se obtiene la funcin generadora de momentos de la distribucin de Poisson.

m(t) = E[etX] =

e tX f (x ) = e tX
x=0 x=0

x e x (e t )x =e e tX =e x! x! x! x=0 x=0

Se tiene el desarrollo de la funcin exponencial:

ey = 1+ y +
t

y 2 y3 + + ... 2! 3!

Haciendo y= e se obtiene Definicin: Funcin generadora de momentos de la distribucin de Poisson

m(t) = e e e
t

Entonces con la definicin conocida:

= 1 =

t t d d m( t ) |t = 0 = e e e |t = 0 = e e e e t |t = 0 = dt dt

Con esto se completa la demostracin La demostracin de la varianza sigue un camino similar.

5.9

APROXIMACIN DE LA DISTRIBUCIN BINOMIAL MEDIANTE LA DISTRIBUCIN DE POISSON

En la distribucin binomial cuando n es grande no es prctico el uso de la frmula. Para entender esto, suponga que n=200, p=0.05 y se quiere calcular la probabilidad que la variable aleatoria X tome el valor 5: n 200 5 200-5 P(X=5) = f(5) = p x (1 p)n x = 0.05 0.95 x 5 El clculo aritmtico puede presentar alguna dificultad En esta situacin se puede calcular la probabilidad mediante un modelo aproximado que se obtiene del lmite al que tiende la distribucin binomial Del desarrollo algebraico que lo omitimos, se obtiene el siguiente resultado para la distribucin binomial: x e np f(x; n, p) , x=0, 1, 2, ...., , cuando n y p0. x! Este modelo corresponde a la distribucin de Poisson con = np Las referencias bibliogrficas indican que esta aproximacin es aceptable para la distribucin binomial si n 20 y p 0.05. Otro criterio utilizado establece que la aproximacin es muy buena si n 100 y np 10

102

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. Calcular con la distribucin binomial x=5, n=200, p=0.05. 200 5 200-5 P(X=5) = f(5) = = 0.036 0.05 0.95 5 Calcular con la distribucin de Poisson x=5, = np = 200*0.05 = 10 P(X=5) = f(5)

x e 105 e 10 = = 0.038 5! x!

Valor cercano al resultado anterior pues n 20 y p 0.05

EJERCICIOS
1) Cierto tipo de tela usada en tapicera tiene, en promedio, dos defectos por metro cuadrado. Si se supone una distribucin de Poisson, calcule la probabilidad que a) Un rollo de 30 m2 tenga no ms de 5 defectos b) Un rollo de 30 m2 tenga al menos 6 defectos c) Un rollo de 60 m2 tenga exactamente 10 defectos 2) Un cargamento grande de libros contiene 3% de ellos con encuadernacin defectuosa. Utilice la aproximacin de Poisson para determinar la probabilidad que entre 400 libros seleccionados al azar del cargamento, a) Exactamente 10 libros estn defectuosos b) Al menos 10 tengan defectos 3) Un bar prepara un batido especial que contiene en promedio 4 frutas diferentes, encuentre la probabilidad de que el batido contenga ms de 4 frutas: a) En un determinado da, b)En tres de los siguientes 5 das,

MATLAB
Probabilidad con la distribucin de Poisson >> f=poisspdf(1,5) Probabilidad con la distribucin de Poisson, x=1, =5 f= 0.0337 >> f=poisscdf(2,5) Probabilidad con la distribucin de Poisson acumulada f= P(X5), =5 0.1247 >> x=0:15; x = 0, 1, 2, . . ., 15 >> f=poisspdf(x,5) Probabilidad con la distribucin de Poisson, =5, x=0, 1, 2, ...15 f = 0.0067 0.0337 0.0842 0.1404 0.1755 0.1755 0.1462 0.1044 0.0653 0.0363 0.0181 0.0082 0.0034 0.0013 0.0005 0.0002 >> bar(f,1,'b') Grfico de la distribucin de Poisson =5, x=0, 1, 2, ...15

103

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

VARIABLES ALEATORIAS CONTINUAS

Las variables aleatorias continuas permiten establecer correspondencia de los resultados obtenidos en experimentos cuyos valores deben medirse en una escala continua y los nmeros reales. Estos resultados pueden provenir de la medicin de la duracin de alguna actividad, pesar un artculo, etc.

6.1

FUNCIN DE DENSIDAD DE PROBABILIDAD

La probabilidad de una variable aleatoria continua puede medirse si existe una funcin denominada funcin de densidad de probabilidad o simplemente funcin de densidad, tal que el rea debajo del grfico de esta funcin cumpla los requisitos para que sea una medida del valor de probabilidad. Definicin: Funcin de densidad de probabilidad Sea X una variable aleatoria continua. Se dice que f es una funcin de densidad de probabilidad si y solo si,

P(aXb) =

f (x )dx ,
a

siendo a,b

Representacin grfica

Cada funcin de densidad de probabilidad debe cumplir las siguientes propiedades: Definicin: Propiedades de una funcin de densidad de probabilidad 1) f(x) 0, - < x < +
+

(f(x) no puede tomar valores negativos (El rea total debajo de f(x) debe ser igual a 1)

2)

f(x)dx = 1

La primera definicin implica que la probabilidad para variables aleatorias continuas solamente puede calcularse para intervalos de la variable. La probabilidad que la variable aleatoria tome algn valor real especfico es cero. Este resultado debe entenderse de la siguiente definicin:
lim P(a X b) = P(b X b) = P(X = b) = f(x)dx = 0
a b b b

Por lo tanto, en el clculo de probabilidad para variables aleatorias continuas, es igual incluir o no incluir los extremos del intervalo:

P(a X b) = P(a < X < b)

104

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

.
Ejemplo Suponga que el tiempo de atencin de cada cliente en una estacin de servicio es una variable aleatoria continua con la funcin de densidad de probabilidad: 2 (x + 2), 0 x 1 f(x) = 5 otro x 0, a) Verifique que cumple las propiedades de una funcin de densidad Sea X: variable aleatoria continua (duracin en horas)

1) f(x) 0, - < x <+: evidente para f(x) especificada


+

2)

1/ 2

f(x)dx = 1:

2 x2 2 1 ( + 2x) = 1 = (x + 2)dx 5 0 5 2 0

b) Calcule la probabilidad que el tiempo de atencin est entre 15 y 30 minutos P(1/4<X<1/2) =

2 x2 2 1/ 2 ( + 2x) = 19 / 80 = 0.2375 = (x + 2)dx 5 1/ 4 5 2 1/ 4

Representacin grfica

6.2

FUNCIN DE DISTRIBUCIN

Al igual que en el caso discreto se puede definir una funcin de probabilidad acumulada, la cual en el caso continuo se denomina funcin de distribucin Definicin: Funcin de distribucin Sea X una variable aleatoria contnua con funcin de densidad f(x) Entonces, la funcin F(x) = P(Xx) =

f (t )dt ,

para - < x < +

se denomina funcin de distribucin de la variable aleatoria X Definicin: Propiedades de la funcin de distribucin 1)


d F(x) = f(x) dx 2) a < b F(a) < F(b), 3) P(a x b) = F(b) F(a)

La derivada de la funcin de distribucin es la densidad F es una funcin creciente

La propiedad 3) es til para calcular valores de probabilidad de la variable X

105

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. Encuentre la funcin de distribucin para el ejemplo anterior Respuesta F(x) =

f(t)dt = 5 (t + 2)dt = 5 ( 2
0

2 t2

+ 2t) =

x 0

2 x2 + 2x) ( 5 2

Esta es una funcin cuyo dominio es el conjunto de los nmeros reales:: x<0 0, 2 2 x F(x) = ( + 2x), 0 x < 1 5 2 1, x1 Grfico de la funcin de distribucin

Use la Funcin de Distribucin para calcular P(1/4<X<1/2) en el ejemplo anterior Respuesta P(1/4<X<1/2) = F(1/2) F(1/4) = = 19/80
2 (1/ 2)2 2 (1/ 4)2 + 2(1/ 2)) - ( + 2(1/ 4)) ( 5 5 2 2

EJERCICIOS
1) La densidad de probabilidad de una variable aleatoria X est dada por 630x 4 (1 x)4 ,0 < x < 1 f(x) = otro x 0, a) Verifique que satisface las propiedades de una funcin de densidad c) Calcule la probabilidad que X tenga un valor mayor a 0.75. e) Determine la probabilidad que X tome un valor dentro del intervalo de dos desviaciones estndar alrededor de la media y compare con el valor proporcionado por el Teorema de Chebyshev. 2) El tiempo que tardan en atender a un individuo en una cafetera es una variable aleatoria con densidad de probabilidad 0.25e 0.25X ,x > 0 , x en minutos f(x) = otro x 0, Calcule la probabilidad que el tiempo que tardan en atenderlo sea ms de 5 minutos

106

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Probabilidad con variables aleatorias continuas >> syms x >> f = 2/5*(x + 2); >> p = int(f, 1/4, 1/2) p= 19/80 >> ezplot(f, 0, 1), grid on Para manejo simblico de la variable x Definicin de una funcin de densidad Clculo de la probabilidad P(1/4 < X < 1/2)

Grfico de la funcin de densidad

>> F = int(f) F= 1/5*x^2+4/5*x

Obtencin de la funcin de distribucin

>> p=eval(subs(F,'1/2')) - eval(subs(F,'1/4')) Clculo de la probabilidad P(1/4 < X < 1/2) p= con la funcin de distribucin: F(1/2) F(1/4) 19/80 >> ezplot(F, 0, 1), grid on Grfico de la funcin de distribucin

107

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

6.3

MEDIA Y VARIANZA DE VARIABLES ALEATORIAS CONTINUAS

Definicin Sean

X es una variable aleatoria continua f(x) funcin de densidad de probabilidad


+

Media de X

= E(X) =

xf (x )dx
+ 2 (x ) f (x )dx

Varianza de X

2 = V(X) = E[(X-)2] =

Ejemplo Calcule la media y la varianza para el ejemplo de la estacin de servicio en donde X es una variable aleatoria continua que representa tiempo de atencin en horas, siendo sudensidad de probabilidad: 2 (x + 2), 0 x 1 f(x) = 5 otro x 0, Respuesta 1 1 2 2 x3 = E(X) = x (x + 2)dx = [ + x 2 ] = 8 / 15 = 0.533 0 5 5 3 0 Es el tiempo de atencin promedio para los clientes

2 = V(X) = E[(X)2] = E(X2) 2 = x 2 (x + 2)dx (8/15)2 = 0.0822


0

2 5

6.3.1 PROPIEDADES DE LA MEDIA Y LA VARIANZA .


Definiciones: Sea X una variable aleatoria continua con densidad de probabilidad f(x) a, b Media E[aX + b] = aE[X] + b Corolarios E(aX) = aE(X) E(b) = b Varianza V[aX + b] = a2V[X] Corolarios V(aX) = a2V(X) V(b) = 0 Las demostraciones y los corolarios son similares al caso de las variables aleatorias discretas con la diferencia que en lugar de sumas, ahora se usan integrales.

108

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

6.3.2 VALOR ESPERADO DE EXPRESIONES CON UNA VARIABLE ALEATORIA


Estas expresiones tambin son variables aleatorias y su dominio es el mismo que el dominio de la variable aleatoria, pero el rango puede ser diferente. Definicin: Valor esperado de expresiones con una variable aleatoria X: f(x): G(X): Entonces Sea Variable aleatoria continua Densidad de probabilidad deX Alguna expresin con la variable aleatoria X
+

G(X) = E[G(X)] =

G(x)f(x)dx

es la media o valor esperado de G(X)

Ejemplo Suponga que en ejemplo de la estacin de servicio, el costo de atencin a cada cliente est dado por la siguiente variable aleatoria: G(X) = 10 + 5X en dlares Calcule la media del costo de atencin Respuesta E[G(X)] = E[10 + 5X] = 10 + 5E[X] = 10 + 5(8/15) = 12.667 dlares

6.4

MOMENTOS Y FUNCIN GENERADORA DE MOMENTOS PARA VARIABLES ALEATORIAS CONTNUAS

Las definiciones que fueron establecidas para las variables aleatorias discretas se extienden al caso discreto sustituyendo sumatorias por integrales Definiciones: Sean

X: variable aleatoria continua f(x): densidad de probabilidad

r-simo momento de X alrededor del origen + r r

r = E[X ] = x f (x )dx

r-simo momento de X alrededor de la media, o r-simo momento central + r r

r = E[(X-) ] = (x ) f (x )dx

Funcin generadora de momentos


+

M(t) = E[e ] =

tX

tx

f(x)dx

Obtencin de momentos alrededor del origen

r =
109

dr M(t) |t=0 dtr

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

6.5

TEOREMA DE CHEBYSHEV

El Teorema de Chebyshev es aplicable tambin a variables aleatorias contnuas. La demostracin usa integrales en lugar de sumatorias Definicin: Sea X una variable aleatoria continua con media y varianza , entonces la probabilidad que X tome algn valor que no se desve de su media 2 en ms de k, es al menos 1 1/k :
2

P( - k < x < - k) 1 1/k2 , k+

EJERCICIOS
1) La densidad de probabilidad de una variable aleatoria X est dada por 630x 4 (1 x)4 ,0 < x < 1 f(x) = otro x 0, a) Calcule la media y varianza de X b) Calcule la media y varianza de la variable Y=2X+1. 2) El tiempo que tardan en atender a una persona en una cafetera es una variable aleatoria con densidad de probabilidad 0.25e 0.25X ,x > 0 , x en minutos f(x) = otro x 0, Calcule la media y varianza de X 3) Demuestre que si X es una variable aleatoria con media tal que f(x)=0, para x<0, entonces para una constante positiva k cualquiera, se tiene: P(x k) k Esta desigualdad se conoce como desigualdad de Markov y es utilizada tambin para acotar el valor de probabilidad de una variable aleatoria.

MATLAB
Media y varianza de variables aleatorias continuas >> syms x >> f = 2/5*(x + 2); >> mu = int(x*f, 0,1) mu = 8/15 >> sigma2 = int(x^2*f,0,1)-mu^2 sigma2 = 37/450 >> sigma = eval(sqrt(sigma2)) sigma = 0.5355 Definir X para manejo simblico Funcin de densidad de X Media de X

Varianza de X

Desviacin estndar

110

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

DISTRIBUCIONES DE PROBABILIDAD CONTINUAS

En este captulo se estudian los modelos matemticos para calcular la probabilidad en algunos problemas tpicos en los que intervienen variables aleatorias continuas. El objetivo es obtener una frmula matemtica f(x) para determinar los valores de probabilidad de la variable aleatoria X.

7.1

DISTRIBUCIN UNIFORME CONTINUA

Este modelo corresponde a una variable aleatoria continua cuyos valores tienen igual valor de probabilidad en un intervalo especificado para la variable Definicin: Distribucin uniforme Sea X: variable aleatoria continua. X tiene distribucin uniforme si su densidad de probabilidad est dada por 1 , axb f(x) = b a 0, para otro x a, b son los parmetros para este modelo

Representacin grfica de la distribucin uniforme continua

Se puede observar que f(x) cumple las propiedades de las funciones de densidad

7.1.1 MEDIA Y VARIANZA: DISTRIBUCIN UNIFORME CONTINUA


Definicin: Sea Media Varianza X: Variable aleatoria con distribucin uniforme continua
1 (a + b) 2 1 (b a)2 2 = V(X) = 12

= E(X) =

Se obtienen directamente de las definiciones respectivas

111

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Demostracin para la media

= E(X) =

xf(x)dx =

x b a dx
a

1 1 2 1 b a2 = (a + b) ba 2 2

7.1.2 FUNCIN DE DISTRIBUCIN DE PROBABILIDAD


De acuerdo a la definicin establecida: F(x) = P(Xx) =

f(t)dt , para - < x < +

Para la distribucin uniforme continua: F(x) = P(Xx) =

f(t)dt =

b a dx = b a
a

xa

x<a 0, x a , ax<b F(x) = b a 1, xb

Ejemplo Cuando falla cierto componente de una mquina, esta debe detenerse hasta que sea reparado. Suponiendo que el tiempo de reparacin puede tomar cualquier valor entre 1 y 5 horas.
a) Calcule la probabilidad que la duracin tome al menos 2 horas

Solucin X: Variable aleatoria continua (duracin de la reparacin) Tiene distribucin uniforme, por lo tanto, su funcin de densidad es 1 1 f(x) = = = 1/4 , 1 x 5 ba 51 P(X 2) =

4 dx = 3/4 = 75%
2

b) Calcule el valor esperado de la duracin de la reparacin

Solucin E(X) =
1 1 (a + b) = (1 + 5) = 3 horas 2 2

b) Suponga que la reparacin tiene un costo fijo de $100 y un costo variable de $10, el cual se incrementa cuadrticamente dependiendo de la duracin. Calcule el valor esperado del costo de la reparacin.

Solucin C: costo de la reparacin (es una variable aleatoria continua) C = 100 + 10 x2 E(C) = E(100 + 10 x2) = 100 + 10 E(X2) E(x2) =
1 1 x3 dx = = 31/3 4 4 3 1 1 E(C) = 100 + 10(31/3) = $203.3
2 x 5 5

112

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) Se elige un punto C sobre una recta AB cuya longitud es k. Si la distancia entre C y A es una variable aleatoria X con distribucin uniforme continua, calcule la probabilidad que la diferencia de longitud entre los segmentos AC y BC no exceda en mas de 10% de k. 2) En un negocio de hamburguesas se despacha el refresco en vasos. La cantidad es una variables aleatoria con una distribucin uniforme entre 130 y 160 ml. (mililitros) a) Calcule la probabilidad de obtener un vaso que contenga a lo ms 140 ml. b) Cuntos ml. contiene en promedio un vaso? c) Obtenga la varianza para la variable aleatoria 3) Una resistencia elctrica se comporta de acuerdo a una distribucin continua con valores entre 900 y 1100 ohms. Encuentre la probabilidad que la resistencia, a) Aguante a lo ms 950 ohms antes de quemarse b) Tenga un valor entre 950 y 1050 ohms.

113

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

7.2

DISTRIBUCIN NORMAL

La Distribucin Normal es la piedra angular de la teora estadstica moderna. Conocida y estudiada desde hace mucho tiempo, es utilizada para describir el comportamiento aleatorio de muchos procesos que ocurren en la naturaleza y tambin realizados por los humanos. Definicin: Funcin de densidad de la distribucin normal Sea X: Variable aleatoria continua con media y varianza X tiene distribucin normal si su funcin de densidad es: 1 x 2 ) ( 1 f (x) = e 2 , - < x < +
2

Se puede demostrar que f cumple las propiedades de una funcin de densidad: 1) f(x) 0, -<x<+:
+

2)

f(x)dx = 1

La grfica de f es similar al perfil del corte vertical de una campana y tiene las siguientes caractersticas: 1) Es simtrica alrededor de 2) Su asntota es el eje horizontal 3) Sus puntos de inflexin estn ubicados en y +

Grfico de la distribucin normal para varios valores de y Para calcular probabilidad se tiene la definicin
b

P(aXb) =

f(x)dx ,
a
x

siendo a,b

Tambin se puede usar la definicin de distribucin acumulada o funcin de distribucin: F(x) = P(Xx) =

f (t )dt ,

para - < x < +

Esta definicin es til para calcular probabilidad con la propiedad: P(aXb) = F(b) F(a)

114

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

7.2.1 DISTRIBUCIN NORMAL ESTNDAR


Para generalizar y facilitar el clculo de probabilidad con la distribucin normal, es conveniente 2 definir la Distribucin Normal Estndar que se obtiene haciendo = 0, y = 1 en la funcin de densidad de la distribucin normal Definicin: Funcin de densidad de la distribucin normal estndar Sea Z: Variable aleatoria continua con media = 0 y varianza = 1 Z tiene distribucin normal estndar si su funcin de densidad es: 1 2 1 2z e f (z) = , - < z < +
2

Para calcular probabilidad con la distribucin normal estndar se puede usar la definicin de la distribucin acumulada o funcin de distribucin:

F(z) = P(Z z) =

f(t)dt =

1 2

1 t2 2 dt

, - < z < +

Grfico de la distribucin normal estndar Para el clculo manual se pueden usar tablas con valores de F(z) para algunos valores de z En un anexo se incluye una tabla de la distribucin normal estndar. Esta tabla contiene los valores de F(z) con 6 decimales para valores de z en el intervalo de 3.59 a 3.59 con incrementos de 0.01. Los valores de F(z) fuera de este intervalo ya no son significativos. Para aplicaciones comunes es suficiente usar slo los cuatro primeros decimales de F(z) redondeando el ltimo dgito. Algunas tablas de la distribucin normal estndar no incluyen valores de F(z) para valores negativos de z, por lo cual y por la simetra de f(z), se puede usar la siguiente relacin:

F(z) = P(Z z) = P(Z z) = 1 P(Z z) = 1 F(z) F( z) = 1 F(z)

115

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplos Usando la tabla de la distribucin normal estndar calcule: a) P(Z 1.45) P(Z 1.45) = F(1.45) = 0.9265
El resultado se toma directamente de la tabla de la distribucin normal estndar:

z
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.500000 0.503989 0.507978 0.511967 0.515953 0.519939 0.532922 0.527903 0.531881 0.535856 0.539828 0.543795 0.547758 0.551717 0.555760 0.559618 0.563559 0.567495 0.571424 0.575345 0.579260 0.583166 0.587064 0.590954 0.594835 0.598706 0.602568 0.606420 0.610261 0.614092 0.617911 0.621719 0.625516 0.629300 0.633072 0.636831 0.640576 0.644309 0.648027 0.651732 0.655422 0.659097 0.662757 0.666402 0.670031 0.673645 0.677242 0.680822 0.684386 0.687933 0.691462 0.694974 0.698468 0.701944 0.705401 0.708840 0.712260 0.715661 0.719043 0.722405 F(1.45) 0.9265 0.754903 0.725747 0.729069 0.732371 0.735653 0.738914 0.742154 0.745373 0 .748571= 0.751748 redondeando el 0.785236 0.758036 0.761148 0.764238 0.767305 0.770350 0.773373 0.776373 0 .779350 0.782305 cuarto decimal 0.788145 0.791030 0.793892 0.796731 0.799546 0.802338 0.805106 0.807850 0.810570 0.813267 0.815940 0.818589 0.821214 0.823815 0.826391 0.828944 0.831472 0.833977 0.836457 0.838913 0.841345 0.843752 0.846136 0.848495 0.850830 0.853141 0.855428 0.857690 0.859929 0.862143 0.864334 0.866500 0.868643 0.870762 0.872857 0.874928 0.876976 0.878999 0.881000 0.882977 0.884930 0.886860 0.888767 0.890651 0.892512 0.894350 0.896165 0.897958 0.899727 0.901475 0.903199 0.904902 0.906582 0.908241 0.909877 0.911492 0.913085 0.914657 0.916207 0.917736 0.919243 0.920730 0.922196 0.923641 0.925066 0.926471 0.927855 0.929219 0.930563 0.931888 0.933193 0.934478 0.935744 0.936992 0.938220 0.939429 0.940620 0.941792 0.942947 0.944083 0.945201 0.946301 0.947384 0.948449 0.949497 0.950529 0.951543 0.952540 0.953521 0.954486

b) P(Z 1.45) P(Z 1.45) = F(1.45) =0.0735 F(1.45) = 1 F(1.45) = 1 0.9265 = 0.0735

(Directamente de la tabla) (Usando la relacin para valores negativos)

c) P(Z 1.45) P(Z 1.45) = 1 P(Z<1.45) = 1 F(1.45) = 1 0.9264 = 0.0735 d) P(1.25 Z 1.45) P(1.25 Z 1.45) = F(1.45) F(1.25) = 0.9265 0.8944 = 0.0321 e) Encuentre z tal que P(Z z) = 0.64 P(Z z) = F(z) = 0.64
En la tabla, el valor de z ms cercano a F(z) = 0.64 corresponde a z = 0.36

z
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.500000 0.503989 0.507978 0.511967 0.515953 0.519939 0.532922 0.527903 0.531881 0.535856 0.539828 0.543795 0.547758 0.551717 0.555760 0.559618 0.563559 0.567495 0.571424 0.575345 0.579260 0.583166 0.587064 0.590954 0.594835 0.598706 0.602568 0.606420 0.610261 0.614092 0.617911 0.621719 0.625516 0.629300 0.633072 0.636831 0.640576 0.644309 0.648027 0.651732 0.655422 0.659097 0.662757 0.666402 0.670031 0.673645 0.677242 0.680822 0.684386 0.687933 0.691462 0.694974 0.698468 0.701944 0.705401 0.708840 0.712260 0.715661 0.719043 0.722405 0.725747 0.729069 0.73 2371es 0.735653 0.7389 Este el valor ms 14 0.742154 0.745373 0.748571 0.751748 0.754903 0.758036 0.761148 0.76 4238 0.767305 0.770350 cercano a F(z) = 0.64 0.773373 0.776373 0.779350 0.782305 0.785236 0.788145 0.791030 0.793892 0.796731 0.799546 0.802338 0.805106 0.807850 0.810570 0.813267

116

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

7.2.2 ESTANDARIZACIN DE LA DISTRIBUCIN NORMAL


Si una variable tiene distribucin normal, mediante una sustitucin se la puede transformar a otra variable con distribucin normal estndar. Este cambio de variable facilita el clculo de probabilidad y se denomina estandarizacin de la distribucin de la variable.

Notacin

X N(, ) Z N(0, 1)
Definicin:

Define a X como una variable con distribucin normal con media y desviacin estndar Define a Z como una variable con distribucin normal estndar con media 0 y desviacin estndar 1

Sea X una variable aleatoria con distribucin normal: X N(, ),

X Tiene distribucin normal estndar: Z N(0, 1)


Entonces, la variable aleatoria

Z=

Representacin grfica

Grfico de la Distribucin Normal y la Distribucin Normal Estndar La relacin entre X y Z es lineal, por lo tanto la distribucin de Z debe tener una forma similar a la distribucin normal. Mediante las definiciones de valor esperado y varianza: X 1 1 E(Z) = E( ) = [E(X) E()] = ( ) = 0 1 1 X ) = 2 [V(X) V()] = 2 (2 0) = 1 V(Z) = V( Se puede probar que Z tiene distribucin normal estndar: Z N(0, 1)

Ejemplo. La duracin de un evento tiene distribucin normal con media 10 y varianza 4. Encuentre la probabilidad que el evento dure a) Menos de 9 horas b) Entre 11 y 12 horas

117

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Respuesta Sea X: variable aleatoria continua (duracin en horas) con distribucin normal: X N(10, 2) X 10 tiene distribucin normal estndar: Z N(0, 1) Entonces Z = 2 9 10 a) P(X 9) = P(Z ) = P(Z 0.5) = F(0.5) = 0.3085 = 30.85% 2 11 10 12 10 b) P(11 X 12) = P( Z ) = P(0.5 Z 1) = F(1) F(0.5) 2 2 = 0.8413 0.6915 = 0.1498

Ejemplo Sea X N(10, ). Encuentre tal que P(X 9) = 0.025 Solucin

P(X 9) = P(Z z) = F(z) = 0.025 z = 1.96 x 9 10 z= 1.96 = = 0.5102

Ejercicio Sea X N(300, 50). Encuentre el valor de k tal que P(X>k) = 0.1075 Solucin

P(X > k) = 0.1075 P(Z > z) = 0.1075 P(Z z) = 1 0.1075 = 0.8925 P(Z z) = F(z) = 0.8925 z = 1.24

118

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Pero, z =

k k 300 1.24 = k = 362 50

7.2.3 VALORES REFERENCIALES DE LA DISTRIBUCIN NORMAL


Hay ciertos valores de la distribucin normal de uso frecuente en aplicaciones. Si X es una variable aleatoria con distribucin normal, la probabilidad que tome valores en un intervalo centrado en , hasta una distancia de una desviacin estndar es aproximadamente 68%, hasta una distancia de 2 es aproximadamente 95% y hasta una distancia de 3 es cercano a 100% como se demuestra a continuacin:

1) P( X < + ) = P(

( ) ( + ) Z ) = P( 1 Z 1) ( 2 ) ( + 2 ) Z ) =P( 2 Z 2) ( 3 ) ( + 3 ) Z ) =P( 3 Z 3)

= F(1) F(1) = 0.8413 0.1587 = 0.6826 = 68.26%

2) P( 2 X < + 2) = P(

= F(2) F(2) = 0.9773 0.0228 = 0.9545 = 95.45%

3) P( 3 X < + 3) = P(

= F(3) F(3) = 0.9987 0.0014 = 0.9973 = 99.73%

7.3

APROXIMACIN DE LA DISTRIBUCIN BINOMIAL CON LA DISTRIBUCIN NORMAL ESTNDAR

Sea X una variable aleatoria discreta con distribucin binomial con media = np, y varianza 2 = np(1-p) Entonces, el lmite de la distribucin de la variable aleatoria

Z=

X np X = , cuando n, np(1 p)

Es la distribucin normal estndar: N(0,1) La demostracin es una aplicacin del Teorema del Lmite Central, uno de los teoremas fundamentales de la estadstica y que ser enunciado posteriormente La bibliografa estadstica establece que la aproximacin es aceptable an con valores pequeos de n, siempre que p est cerca de 0.5, o si simultneamente:

np > 5 y

n(1-p) > 5

119

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo En una fbrica, el 20% de los artculos salen defectuosos. Calcule la probabilidad que en un lote de 100 artculos elegidos al azar, 15 sean defectuosos Respuesta Sea X: variable aleatoria discreta con distribucin binomial, con n=20, p=0.2
El clculo con el modelo de la distribucin binomial puede ser imprctico:

P(X=x) =

n x 100 15 85 p (1-p)n-x P(X=15) = (0.2) (0.8) 15 x

Se observa que np = 100(0.2) = 20, n(1p) = 100(0.8) = 80. Siendo ambos productos mayores a 5, segn el criterio dado, la distribucin normal estndar ser una aproximacin aceptable:

Z=

X X np = = np(1 p)

X 100(0.20) 100(0.20)(0.80)

X 20 4

P(X = 15) P(

14.5 15.5 14.5 20 15.5 20 Z Z ) = P( ) 4 4 = P(1.375 Z 1.125) = F(1.125) F(1.375)

= 0.130 0.084 = 0.046 = 4.6%


Observe la correccin que se realiza al tomar el valor discreto para usarlo en la distribucin normal. Para la distribucin normal se considera que un valor discreto se extiende entre las mitades de los valores adyacentes: el valor 15 de la distribucin binomial corresponde al intervalo (14.5, 15.5) para la distribucin normal.

120

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) Suponga que Z es una variable aleatoria con distribucin normal estndar. Use la tabla para calcular: a) P(Z<1.45) b) P(Z>2.01) c) P(Z<-1.24) d) P(Z>1.78) e) P(-1.25<Z<2.31) 2) Suponga que X es una variable aleatoria con distribucin normal, con media 25 y desviacin estndar 5. Use la tabla para calcular a) P(X<18) b) P(X>30) c) P(24<X<27) 3) Si X ~ N(10, 2) determine el valor de la varianza si P(X<9)=0.025 4) El peso de los artculos producidos por una fbrica tiene distribucin normal con una media de 50 gr. y una desviacin estndar de 5 gr. a) Calcule la probabilidad que un artculo elegido al azar tenga un peso de mas de 60 gr. b) Calcule la proporcin de los paquetes que tendran un peso entre 46 y 54 gr. 5) El tiempo necesario para llenar un frasco de un producto es una variable aleatoria que sigue una distribucin normal con una media de 10 segundos y una desviacin estndar de dos segundos. a) Calcule la probabilidad que el tiempo de llenado exceda a 11 segundos b) Encuentre el tiempo de llenado del frasco tal que la probabilidad de excederlo tenga una probabilidad de 3% 6) Una fbrica de tornillos produce un tipo de tornillo con un dimetro promedio de 6.5 mm. y una desviacin estndar de 1.5 mm. Suponiendo que la distribucin es normal calcule la probabilidad de encontrar tornillos con dimetro a) mayor que 7mm. b) entre 6 y 7 mm. 7) El pH de un qumico tiene una distribucin N(, 0.102). Durante la elaboracin del producto se ordena suspender la produccin si el pH supera el valor 7.20 o es inferior a 6.80. a) Calcule la probabilidad que la produccin no sea suspendida si =7.0 b) Calcule la probabilidad que la produccin no sea suspendida si =7.05 c) Cual debe ser para que la probabilidad de que se suspenda la produccin sea 0.85 8) La tolerancia especificada para aceptar los ejes producidos por una fbrica es que el dimetro sea 0.45 0.005 cm. Si los ejes producidos por la fbrica tienen distribucin normal con media 0.452 y desviacin estndar 0.003 cm., determine cuantos ejes sern rechazados de cada lote de 500 ejes producidos.

121

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Probabilidad con la distribucin normal >> p=normcdf(-1.45) p= 0.0735 >> p=normcdf(1.45)-normcdf(1.25) p= 0.0321 >> p=normcdf(9, 10, 2) p= 0.3085 >> x=norminv(0.3085, 10, 2) x= 8.9998 >> x=-6: 0.5: 9; >> f=normpdf(x, 2, 1.8); >> plot(x,f,'b'), grid on >> legend('mu=2, sigma=1.8')
Distribucin normal estndar acumulada, P(Z -1.45) Calcular P(1.25 Z 1.45) Distribucin normal: calcular P(X 9), =10, = 2

Funcin inversa: calcular x tal que F(x) = 0.3085 =10, = 2

x = -6, -5.5, -5.0, . . ., 9 Valores de densidad normal f(x), = 2, = 1.8 Grfico de la funcin de densidad normal

>> f=normcdf(x, 2, 1.8); >> plot(x,f,'ob'), grid on >> hold on >> plot(x,f,'b')

Valores de la distribucin acumulada = 2, = 1.8 Grfico de puntos de F(x) Superponer grfico Grfico de la distribucin acumulada F(x)

122

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

7.4

DISTRIBUCIN GAMMA

Es un modelo bsico en la teora estadstica y corresponde a la siguiente definicin Definicin Sea X una variable aleatoria continua X tiene distribucin Gamma si su funcin de densidad es 1 x 1e x / , x > 0 f(x) = () 0, para otro x >0, >0 son los parmetros para este modelo () es la funcin gamma que est definida de la siguiente forma:

( ) =

x
0

1 x

e dx

Si es un entero positivo, entonces () = ( - 1)! Demostracin

( ) =

x
0

1 x

e dx

u = x-1 du = (-1)x-2 dx dv = e-x dx v = -e-x Se obtiene


0

Para integrar por partes

() = ( 1) x 2 e x dx = ( - 1)( - 1)

Sucesivamente () = ( -1)(-2)(-3)...(1). Finalmente, (1) = 1 por integracin directa. Graficacin de la distribucin gamma + Son grficos asimtricos con sesgo positivo y su dominio es

La distribucin Gamma para algunos valores de ,

123

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

7.4.1 MEDIA Y VARIANZA PARA LA DISTRIBUCIN GAMMA


Definicin: Sea X una variable aleatoria continua con distribucin gamma, entonces = E(X) = Varianza: 2 = V(X) = 2 Media:

Demostracin

xf(x)dx =

x ( ) x
0

1 x /

dx =

x ( )
0

e x / dx

Mediante la sustitucin y = x/

=
=

1 ( )

( y)

e y dy

y e y dy ( ) 0

Con la definicin de la funcin Gamma: ( + 1) = () = = ( ) ( ) Ejemplo El tiempo en horas que semanalmente requiere una mquina para mantenimiento es una variable aleatoria con distribucin gamma con parmetros =3, =2 a) Encuentre la probabilidad que en alguna semana el tiempo de mantenimiento sea mayor a 8 horas b) Si el costo de mantenimiento en dlares es C = 30X + 2X2, siendo X el tiempo de mantenimiento, encuentre el costo promedio de mantenimiento. Solucin Sea X: duracin del mantenimiento en horas (variable aleatoria) Su densidad de probabilidad es: 1 1 1 2 x / 2 f(x) = x 1e x / = 3 x 3 1e x / 2 = x e 16 ( ) 2 (3)

Grfico de la funcin de densidad para el ejemplo

124

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

a) P(X>8) es el rea resaltada en el grfico P(X>8) = 1 P(X8) = 1


1 x 2 e x / 2 dx 16 0
8

Para integrar se pueden aplicar dos veces la tcnica de integracin por partes:

x e
2

x / 2

dx ,
u = x2 du = 2x dx dv = e-x/2 dx v = 2 e-x/2

= 2x2 e-x/2 + 4 x e x / 2 dx

e x / 2 dx

u = x du = dx dv = e-x/2dx v = 2 e-x/2 = 2x e-x/2 + 2 e x / 2 dx Sustituyendo los resultados intermedios, 8 1 -2x 2 e-x/2 + 4(-2x e-x/2 + 2(-2 e-x/2 )) = 0.2381 P(X>8) = 1 0 16 2 2 b) E(C) = E(30X + 2X ) = 30 E(X) + 2 E(X ) E(X) = = 3(2) = 6

E(X2) =

x 2 f(x)dx = x 2
0

1 2 x / 2 1 x e dx = x 4 e x / 2 dx 16 16 0

Sustituya y = x/2 para usar la funcin Gamma =


1 (2y)4 e y (2dy) = 2 y 4 e y dy = 2(5) = 2(4!) = 48 16 0 0

Finalmente se obtiene E(C) = 30(6) + 2(48) = 276 dlares

7.5

DISTRIBUCIN EXPONENCIAL

Es un caso particular de la distribucin gamma y tiene aplicaciones de inters prctico. Se obtiene con = 1 en la distribucin gamma Definicin Sea X una variable aleatoria continua X X tiene distribucin exponencial si su densidad de probabilidad est dada por 1 x / , x>0 e f(x) = 0, para otro x En donde >0, es el parmetro para este modelo El grfico de la densidad de probabilidad tiene la forma tpica exponencial decreciente.

125

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

7.5.1 MEDIA Y VARIANZA PARA LA DISTRIBUCIN EXPONENCIAL


Definicin: Sea X una variable aleatoria continua con distribucin exponencial, entonces Media: = E(X) = Varianza: 2 = V(X) = 2 Se obtienen directamente de la distribucin gamma con = 1 Problema Un sistema usa un componente cuya duracin en aos es una variable aleatoria con distribucin exponencial con media de 4 aos. Si se instalan 3 de estos componentes y trabajan independientemente, determine la probabilidad que al cabo de 6 aos, dos de ellos sigan funcionando. Solucin Sea Y: variable aleatoria continua (duracin de un componente en aos) Y tiene distribucin exponencial con = = 4 Su densidad de probabilidad es 1 f(y) = e y / 4 , y > 0 4 La probabilidad que un componente siga funcionando al cabo de 6 aos: P(Y6) = 1 P(Y<6) = 1

4e
0

y / 4

dy = 0.2231

Sea X: variable aleatoria discreta (cantidad de componentes que siguen funcionando luego de 6 aos) X tiene distribucin binomial con n=3, p=0.2231 Su funcin de distribucin de probabilidad es: n 3 f(x) = p x (1 p)n x = 0.2231x 0.77693 x x x Entonces, 3 P(X=2) = f(2) = 0.22312 0.77693 2 = 0.1160 = 11.6% 2

126

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

7.5.2 UNA APLICACIN DE LA DISTRIBUCIN EXPONENCIAL


Puede demostrarse que si una variable aleatoria tiene distribucin de Poisson con parmetro , entonces el tiempo de espera entre dos xitos consecutivos es una variable aleatoria con distribucin exponencial con parmetro = 1/ Ejemplo La llegada de los barcos a un puerto tiene distribucin de Poisson con media de 4 por da. Calcule la probabilidad que el tiempo transcurrido entre la llegada de dos barcos consecutivos en algn da sea menor a 4 horas. Solucin Sea X el tiempo transcurrido entre dos llegadas consecutivas (en das) X es una variable aleatoria continua con distribucin exponencial con parmetro = 1/ = 1/4 Su funcin de probabilidad es 1 f(x) = e x / = e-x = 4e-4x, x>0
1/ 6

Por lo tanto, P(X<1/6) =

4e 4x dx = 0.4866 = 48.66%

EJERCICIOS
1) En cierta ciudad, el consumo diario de energa elctrica en millones de Kw-hora puede considerarse como una variable aleatoria con distribucin Gamma con =3 y =2. Si la planta de energa tiene una capacidad de produccin diaria de doce millones de Kw-hora, calcule la probabilidad que en un da cualquiera, el suministro de energa sea insuficiente. 2) La duracin en miles de Km. de cierto tipo de llantas, es una variable aleatoria con distribucin exponencial con media 40 mil Km. Calcule la probabilidad que una de estas llantas dure a) Al menos 20 mil Km. b) No ms de 30 mil Km. 3) El tiempo que transcurre antes de que una persona sea atendida en un bar es una variable aleatoria que se puede modelar col la distribucin exponencial con una media de 5 minutos. Calcule la probabilidad de que una persona sea atendida antes de que transcurran 3 minutos en al menos 4 de los 7 das siguientes. 4) Se conoce que la cantidad de reparaciones que cierto tipo de electrodomstico necesita, tiene distribucin de Poisson con una media de una vez cada dos aos. Suponiendo que los intervalos entre reparaciones tienen distribucin exponencial. Calcule la probabilidad que este artculo funcione por lo menos tres aos sin requerir reparacin.

127

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Probabilidad con la distribucin gamma >> x=0:0.5:30; x = 0, 0.5, 1, . . ., 30 >> f=gampdf(x, 3, 2); Valores de densidad de probabilidad gamma, = 3, = 2 >> plot(x, f, 'b'), grid on Grfico de la densidad de probabilidad gamma, = 3, = 2 >> legend('Gamma, alfa=3, beta=2');

>> p=gamcdf(8, 3, 2) p= 0.7619 >> x=gaminv(0.7619, 3, 2) x= 8.0000 >> [mu, var]=gamstat(3, 2) mu = 6 var = 12

Distribucin gamma acumulada: F(8) = P(X8), = 3, = 2 Distribucin gamma acumulada inversa: Encontrar x tal que P(Xx) = 0.7619, = 3, = 2 Media y varianza de la distribucin gamma, = 3, = 2

Probabilidad con la distribucin exponencial >> x=0:0.5:20; x = 0, 0.5, 1.0, ..., 20 >> f=exppdf(x,4); Valores de densidad de probabilidad exponencial, = 4 >> plot(x,f,'k'),grid on Grfico de la densidad de probabilidad exponencial = 4 >> legend('Distribucion exponencial, beta=4')

128

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

>> p=expcdf(6, 4) p= 0.7769 >> x=expinv(0.7769, 4) x= 6.000

Distribucin exponencial acumulada: F(6) = P(X6), = 4 Distribucin exponencial acumulada inversa: Encontrar x tal que P(Xx) = 0.7769, = 4

129

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

7.6

DISTRIBUCIN DE WEIBULL

Este modelo propuesto por Weibull se usa en problemas relacionados con falla de materiales y estudios de confiabilidad. Para estas aplicaciones es ms flexible que el modelo exponencial Definicin Una variable aleatoria continua X tiene distribucin de Weibull si su densidad de probabilidad est dada por

x 1e x , x>0 f(x) = para otro x 0,

En donde >0, >0 son los parmetros para este modelo Si = 1, este modelo se reduce a la distribucin exponencial. Si > 1, el modelo tiene forma acampanada con sesgo positivo

Grficos de la distribucin de Weibull

7.6.1 MEDIA Y VARIANZA PARA LA DISTRIBUCIN DE WEIBULL


Definicin Si X es una variable aleatoria continua con distribucin de Weibull, entonces Media Varianza

= E(X) = -1/(1+1/) 2 = V(X) = -2/[(1+2/) ((1+1/))2]

Demostracin Con la definicin

= E(X) =

xf(x)dx = x x
0

e x dx

Usando la sustitucin y = x dy = x-1dx = yx-1dx = y(y/)-1/dx Se obtiene

-1/

y
0

1/

e y dy

Finalmente, se compara con la funcin gamma = -1/(1+1/)

130

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo Suponga que la vida til en horas de un componente electrnico tiene distribucin de Weibull con =0.1, =0.5 a) Calcule la vida til promedio b) Calcule la probabilidad que dure mas de 300 horas Solucin Sea X: vida til en horas (variable aleatoria continua) su densidad de probabilidad: f(x)= x 1e x = 0.05x 0.5 e 0.1x a) = -1/(1+1/) = (0.1)-1/0.5(1+1/0.5) = 0.1-2(3) = 200 horas
0.5

b) P(X>300) =

300

0.05x 0.5 e 0.1x dx


0.5

Mediante la sustitucin y=x se obtiene P(X>300) = 0.05

0.5

dy = 0.5x

-0.5

dx = 0.5(

1 y )dx dx = dy y 0.5

1 0.1y y 0.1 y e 0.5 dy =0.1 e dy 300 300


300

= 1 P(X300) = 1 0.1

e 0.1dy = 0.177

7.7

RAZN DE FALLA

Si la variable aleatoria es el tiempo t en que falla un equipo, el ndice o razn de falla en el instante t es la funcin de densidad de falla al tiempo t, dado que la falla no ocurre antes de t.

Definicin: t: Variable aleatoria continua (tiempo) f(t): Funcin de densidad de probabilidad F(t): Funcin de distribucin (funcin de probabilidad acumulada) Entonces f(t) r(t) = es la razn de falla 1 F(t)
Sean

7.8

DISTRIBUCIN BETA

Este modelo tiene aplicaciones importantes por la variedad de formas diferentes que puede tomar su funcin de densidad eligiendo valores para sus parmetros.

Definicin
Una variable aleatoria continua X tiene distribucin beta si su densidad de probabilidad est dada por

( + ) -1 x (1-x) -1, 0 < x < 1 f(x) = ()() 0, para otro x


En donde >0, >0 son los parmetros para este modelo. ( ) es la funcin gamma El dominio de la distribucin beta es el intervalo (0, 1), pero puede adaptarse a otros intervalos finitos mediante alguna sustitucin.

131

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Grfico de la distribucin beta para algunos valores ,

7.8.1 MEDIA Y VARIANZA PARA LA DISTRIBUCIN BETA


Definicin
Si X es una variable aleatoria continua con distribucin beta, entonces Media: = E(X) = + 2 = V(X) = Varianza: 2 ( + ) ( + + 1) La demostracin se fundamenta en la definicin de la funcin beta.

Ejemplo Un distribuidor de cierto producto llena su bodega al inicio de cada semana. La proporcin del artculo que vende semanalmente se puede modelar con la distribucin beta con =4, =2 a) Encuentre el valor esperado de la proporcin de venta semanal b) Encuentre la probabilidad que en alguna semana venda al menos 90% Solucin Sea X: proporcin del artculo que vende semanalmente (variable aleatoria continua) Su densidad de probabilidad es (4 + 2) 4 1 x (1 x)2 1 = 20x3(1-x), 0<x<1 f(x) = (4)(2) 4 a) = E(X) = = = 2/3 (vende en promedio 2/3 del artculo cada semana) + 4+2 b) P(x0.9) = 20 x 3 (1 x)dx = 0.082 = 8.2%. Es el rea marcada en el siguiente grfico
0.9 1

132

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

7.9

DISTRIBUCIN DE ERLANG

La funcin de densidad de la distribucin de Erlang es igual a la distribucin gamma, pero el parmetro debe ser entero positivo.

Definicin
Una variable aleatoria continua X tiene distribucin de Erlang si su densidad de probabilidad est dada por .

1 x 1e x / , x > 0 f(x) = () 0, para otro x


>0, >0 son los parmetros para este modelo, entero positivo

7.9.1 MEDIA Y VARIANZA PARA LA DISTRIBUCIN DE ERLANG


Definicin
Si X es una variable aleatoria continua con distribucin de Erlang, entonces

Media:

= E(X) = ,

Varianza:

2 = V(X) = 2

7.10 DISTRIBUCIN JI-CUADRADO


Este modelo es importante en el estudio de la estadstica inferencial. distribucin gamma con = /2, = 2 Se obtiene de la

Definicin
Una variable aleatoria continua X tiene distribucin Ji-cuadrada si su densidad de probabilidad est dada por
1 1 x 2 e x / 2 , x > 0 /2 f(x) = 2 ( / 2) 0, para otro x

Esta distribucin tiene un parmetro: > 0 y se denomina nmero de grados de libertad.

7.10.1 MEDIA Y VARIANZA PARA LA DISTRIBUCIN JI-CUADRADO


Definicin
Si X es una variable aleatoria continua con distribucin Ji-cuadrado, entonces

Media

= E(X) = ,

Varianza:

2 = V(X) = 2

Se obtienen directamente de la distribucin gamma con = /2, = 2

133

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) Si la proporcin anual de declaraciones incorrectas del impuesto sobre la renta entregadas al fisco puede considerarse como una variable aleatoria que tiene una distribucin Beta con =2 y =9. a) Calcule la probabilidad que en un ao cualquiera haya mas de 40% de declaraciones incorrectas b) Encuentre la media de esta distribucin, es decir, la proporcin de declaraciones que en promedio sern incorrectas 2) Suponga que el tiempo de servicio en horas de un semiconductor es una variable aleatoria que tiene distribucin de Weibull con =0.025, =0.5 a) Calcule el tiempo esperado de duracin del semiconductor b) Calcule la probabilidad que este semiconductor est funcionando despus de 4000 horas de uso 3) Sea t una variable aleatoria continua que representa el tiempo de falla de un equipo. Demuestre que si t tiene distribucin exponencial, la razn de falla es constante. 4) Durante cada turno de trabajo de 8 horas, la proporcin de tiempo que una mquina est en reparacin tiene distribucin beta con =1 y =2. a) Determine la probabilidad que la proporcin del turno que la mquina est en reparacin se menor que 2 horas b) Si el costo de reparacin es $100 mas $10 por la duracin al cuadrado, encuentre el valor esperado del costo de reparacin

134

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Distribucin de Weibull >> p=weibcdf(300,0.1,0.5) Distribucin acumulada Weibull , = 0.1, = 0.5 p= Calcular P(X300) 0.8231 >> [mu, var]=weibstat(0.1, 0.5) Media y varianza distr. Weibull, = 0.1, = 0.5 mu = 200.0000 var = 2.0000e+005 >> x=0:0.1:5; >> f=weibpdf(x,0.8,1.5); Puntos de la distr. Weibull, = 0.8, = 1.5 Grfico de la distribucin Weibull >> plot(x,f,'k'), grid on >> legend('Weibull - alfa = 0.8, beta = 1.5')

Distribucin beta >> p=betacdf(0.9, 4, 2) Distribucin acumulada beta, = 4, = 2 p= Calcular P(X0.9) 0.9185 >> x=betainv(0.9185, 4, 2) Distribucin beta inversa Calcular x tal que F(x) = 0.9185, = 4, = 2 x= 0.9000 >> [mu, var] = betastat(4, 2) Media y varianza distr. beta, = 4, = 2 mu = 0.6667 var = 0.0317 >> x=0: 0.05: 1; >> f=betapdf(x, 4, 2); Puntos de la distr. beta, = 4, = 2 Grfico de la distribucin beta >> plot(x, f, 'k'), grid on >> legend('Distribucion beta, alfa=4, beta=2')

135

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Distribucin ji-cuadrado >> p=chi2cdf(2,5) Distribucin acumulada ji-cuadrado, = 5 p= Calcular P(X2) 0.1509 Media y varianza distr. ji-cuadrado, = 5 >> [mu, var]=chi2stat(5) mu = 5 var = 10 >> x=0:0.5:20; >> f=chi2pdf(x,5); Puntos de la distr. ji-cuadrado, = 5 Grfico de la distribucin ji-cuadrado >> plot(x,f,'k'), grid on >> legend('Distribucion ji-cuadrado, nu=5')

136

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

7.11 DISTRIBUCIN EMPRICA ACUMULADA


Esta distribucin es un modelo matemtico que se asigna a un conjunto de datos cuando se desconoce si pertenecen a un modelo de probabilidad especfico. La distribucin emprica acumulada es una funcin de probabilidad que asocia cada valor de la variable x con la proporcin de datos menores que el valor de x dado Definicin: Distribucin emprica acumulada Sean

x1, x2, . . ., xn , datos obtenidos en una muestra. Si se escriben estos datos en orden creciente: x(1), x(2), . . ., x(n)
Se define la distribucin emprica acumulada x < x (1) 0, i F(x) = , x (i) x < x (i + 1) , x n x x (n) 1,

Ejemplo. Dados los siguientes datos de una muestra: 4, 3, 8, 6, 5 Encuentre y grafique la distribucin emprica Solucin Datos ordenados:

3, 4, 5, 6, 8

(n=5)

Su distribucin emprica acumulada es:


0, 1/ 5, 2 / 5, F(x) = 3 / 5, 4 / 5, 1, x<3 3x<4 4x<5 5x<6 6x<8 x8

Grfico de la distribucin emprica acumulada

EJERCICIOS
1) Grafique la distribucin emprica correspondiente a los siguientes datos 14, 5, 8, 3, 8, 7, 11, 13, 14, 3 2) Calcule la media aritmtica, mediana, varianza, y distribucin emprica de la siguiente muestra: 4, 8, 2, 7, 10, 8, 4, 9, 7

137

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Grfico de la distribucin emprica y la distribucin normal acumuladas >> x=[3 4 5 6 8]; Vector con datos de una muestra >> cdfplot(x) Grfico de la distribucin emprica acumulada >> m=mean(x); Media muestral >> s=std(x); Desviacin estndar muestral >> z=0: 0.1: 10; Puntos para la distribucin normal acumulada >> hold on Para superponer grficos >> f=normcdf(z, m, s); Valores de la distribucin normal acumulada para los puntos >> plot(z, f, '.k') Grfico de la distribucin normal acumulada, puntos en negro >> legend('Distribucion empirica','Distribucion normal',2) Colocar rtulos arriba izquierda

El nmero 2 indica que los rtulos se coloquen arriba a la izquierda

138

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

DISTRIBUCIONES DE PROBABILIDAD CONJUNTA

Algunos experimentos estadsticos pueden incluir ms de una variable aleatoria las cuales actan en forma conjunta, y es de inters determinar la probabilidad correspondiente a los diferentes valores que estas variables puedan tomar.

8.1

CASO DISCRETO BIVARIADO

8.1.1 DISTRIBUCIN DE PROBABILIDAD CONJUNTA


Definicin: Distribucin de probabilidad conjunta X, Y: variables aleatorias discretas. x, y: valores que pueden tomar X, Y Su funcin de distribucin de probabilidad conjunta se escribe f(x,y) y describe el valor de probabilidad en cada punto P(X=x, Y=y) Sean Esta funcin establece correspondencia de (x,y) a (0,1) y satisface las siguientes propiedades 1) xy f(x,y)0 f no puede tomar valores negativos 2) f(x, y) = 1 La suma de todos los valores de f debe ser 1
x y

3) P(X=x, Y=y) = f(x,y)

f debe ser un modelo til para calcular probabilidad

8.1.2 DISTRIBUCIN DE PROBABILIDAD ACUMULADA CONJUNTA


Definicin: Distribucin de probabilidad acumulada conjunta F(x,y) = P(Xx, Yy) =

s x t y

f(s,t) , - x, y

Ejemplo Suponga que X, Y son variables aleatorias discretas cuya funcin de distribucin de probabilidad est descrita en el siguiente cuadro X Y 1 2 0 0.1 0.3 1 0.2 0.1 2 0.05 0.25

Valores de f(x, y)

a) Verifique que f(x, y) cumple las propiedades 1) y 2) Por simple observacin en el cuadro con los valores de f(x,y) b) Determine la probabilidad que X=0 y que Y=2 P(X=0, Y=2) = f(0, 2) = 0.3 c) Calcule la probabilidad que X>0 y que Y=1 P(X>0, Y=1) = f(1,1) + f(2,1) = 0.2 + 0.05 = 0.25

Ejemplo Determine el valor de k para que la funcin f(x,y) = kxy, x = 1, 2, 3; y = 1, 2 Pueda usarse como una funcin de probabilidad conjunta con las variables X, Y

139

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Si es una funcin de probabilidad debe cumplir la propiedad Tabulacin de los valores de f(x, y) x y f(x,y) 1 1 k 2 2k 2 1 2k 2 4k 3 1 3k 2 6k Entonces:
x =1 y =1

f(x, y) = 1
x y

f(x, y) = k + 2k + 2k + 4k + 3k + 6k = 18k = 1

k = 1/18

As, la funcin de distribucin de probabilidad conjunta es 1 xy, x=1, 2, 3; y=1, 2; cero para otros (x, y) f(x, y) = 18 Se puede expresar en forma tabular X Y 1 2 1 1/18 2/18 2 2/18 4/18 3 3/18 6/18

Se puede usar una representacin grfica en tres dimensiones:

8.1.3 DISTRIBUCIONES DE PROBABILIDAD MARGINAL


Cuando se estudian ms de una variable aleatoria en forma conjunta, puede ser de inters conocer la distribucin de probabilidad de las variables aleatorias individualmente. Estas funciones se denominan distribuciones marginales Definiciones X,Y variables aleatorias discretas y f(x,y) funcin de probabilidad conjunta. Entonces g(x) = f(x, y) Distribucin marginal de X Sean
y

h(y) =

f(x, y)
x

Distribucin marginal de Y

140

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Las distribuciones marginales g(x), h(y) son funciones de probabilidad de las variables aleatorias X, Y separadamente. Estas funciones deben cumplir las propiedades de una funcin de probabilidad y pueden ser usadas para calcular probabilidad para cada variable. 1) g(x)0, h(y)>0, x,y 2) g(x) = 1, h(y)=1
x y

3) P(X=x) = g(x) P(Y=y) = h(y) Ejemplo. Suponga que X, Y son variables aleatorias discretas cuya funcin de distribucin de probabilidad conjunta est descrita en el siguiente cuadro X 0 1 2 0.1 0.2 0.05 1 Y 0.3 0.1 0.25 2 a) Encuentre las distribuciones marginales tabularmente Se suman los valores de filas y columnas y se escriben en los mrgenes. Estos valores representan la probabilidad de una variable, incluyendo todos los valores de la otra variable. X 0 1 2 h(y) 0.1 0.2 0.05 1 0.35 Y 0.3 0.1 0.25 2 0.65 g(x) 0.4 0.3 0.3 1 b) Calcule P(X=1) P(X=1) = g(1) = 0.3 c) Calcule P(Y=2) P(Y=2) = h(2) = 0.65

Ejemplo Sean X, Y variables aleatorias con la siguiente funcin de probabilidad conjunta 1 f(x,y) = xy, x=1, 2, 3; y=1, 2 18 a) Encuentre las distribuciones marginales analticamente 2 1 x 2 x x g(x) = f(x, y) = xy = y = 18 (1 + 2) = 6 , x = 1, 2, 3 18 18 y y =1 y =1

h(y) =

f(x, y) =
x

1 y 3 y y xy x= (1 + 2 + 3) = , = 18 18 x =1 18 3 x =1

y = 1, 2

b) Calcule P(X=3), P(Y=1) P(X=3) = g(3) = 1/2 P(Y=1) = h(1) = 1/3 En los ejemplos anteriores se puede verificar que las distribuciones marginales g(x) y h(y) cumplen las propiedades 1), 2), tabularmente o analticamente.

141

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

8.1.4 DISTRIBUCIONES DE PROBABILIDAD CONDICIONAL


Cuando se estudian ms de una variable aleatoria en forma conjunta, puede ser de inters conocer la distribucin de probabilidad de cada variable aleatoria dado que la otra variable aleatoria toma un valor especfico. Estas funciones se denominan distribuciones condicionales. Recordemos la frmula de probabilidad condicional para eventos P(A|B) = P(AB)/P(B) Definamos los eventos A, B de la siguiente manera A: X=x B: Y=y Siendo X, Y variables aleatorias discretas con distribucin de probabilidad conjunta f(x,y), Entonces, P(X = x,Y = y) P(X=x|Y=y) = P(Y = y) Que se puede expresar con la notacin establecida para las distribuciones conjuntas: f(x, y) f(x|y) = h(y) La funcin f(x|y) tambin satisface las propiedades de las funciones de probabilidad Definiciones X, Y variables aleatorias discretas f(x, y) distribucin de probabilidad conjunta Entonces, f(x, y) f(x|y) = Es la distribucin condicional de X dado que Y=y h(y) f(x, y) Es la distribucin condicional de Y dado que X=x f(y|x) = g(x) Sean Las distribuciones condicionales f(x|y), f(y|x) son funciones de probabilidad de X, Y. Estas funciones cumplen las propiedades establecidas y pueden usarse para calcular probabilidad condicional. 1) f(x|y) 0, x, 2) f(x | y) = 1 ,
x

f(y|x) 0, y f(y | x) = 1
y

Ejemplo. Suponga que X, Y son variables aleatorias discretas cuya funcin de distribucin de probabilidad est descrita en el siguiente cuadro X 0 1 2 h(y) Y 0.1 0.2 0.05 0.35 1 0.3 0.1 0.25 0.65 2 0.4 0.3 0.3 1 g(x) Calcule la probabilidad condicional P(X=2 | Y=1) P(X=2 | Y=1) = f(2 | 1) =

f(2,1) 0.05 = = 0.1429 h(1) 0.35

142

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo Sean X, Y variables aleatorias con la siguiente funcin de probabilidad conjunta 1 xy, x=1, 2, 3; y=1, 2; cero para otro (x, y) f(x,y) = 18 a) Encuentre las distribuciones condicionales analticamente Previamente se obtuvieron las distribuciones marginales: g(x) = x / 6 , x = 1, 2, 3 h(y) = y / 3 , y = 1, 2 Por lo tanto, para este problema: 1 xy f(x, y) 18 x f(x | y) = = = Significa que X no depende de Y y h(y) 6 3 1 xy f(x, y) 18 y f(y | x) = = = Significa que Y no depende de X x g(x) 3 6 b) Calcule la probabilidad condicional P(X=1 | Y=2) P(X=x | Y=y) = f(x | y) =
x P(X=1 | Y=2) = f(1 | 2) = 1/6 6

8.1.5 VARIABLES ALEATORIAS DISCRETAS INDEPENDIENTES


Definicin Se dice que X, Y son variables aleatorias discretas estadsticamente independientes si y solo si en cada punto (x, y): f(x,y) = g(x) h(y) Demostracin Sean X,Y variables aleatorias discretas y f(x,y) su distribucin de probabilidad conjunta. Su distribucin condicional f(x|y) es f(x, y) f(x|y) = h(y) Su distribucin marginal g(x) es: g(x) = f(x, y)
y

Sustituimos la distribucin condicional en la distribucin marginal: g(x) = f(x | y)h(y)


y

Supongamos que f(x|y) no depende de y. Esto significa que la expresin f(x|y) no contendr a la variable y. Por lo tanto, puede salir de la sumatoria: g(x) = f(x|y) h(y)
y

Pero

h(y) = 1 ,
y

pues h(y) es tambin una funcin de distribucin de probabilidad .

Entonces f(x|y) = g(x) Sustituyendo en la distribucin condicional al inico, se obtiene f(x,y) = g(x) h(y)

143

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo Sean X, Y variables aleatorias discretas cuya funcin de distribucin de probabilidad conjunta 1 es f(x,y) = xy, x=1, 2, 3; y=1, 2 18 Pruebe que X, Y son variables aleatorias estadsticamente independientes Solucin Se tienen las distribuciones marginales x g(x) = , x = 1, 2, 3 6 y h(y) = , y = 1, 2 3 Entonces x y 1 g(x)h(y) = ( )( ) = xy = f(x,y), x = 1, 2, 3; y = 1, 2 6 3 18 Por lo tanto, X, Y son variables aleatorias estadsticamente independientes. Siendo X, Y variables aleatorias estadsticamente independientes se cumple tambin que 1 1 xy xy f(x, y) 18 x f(x, y) 18 y f(x | y) = = = f(y | x) = = g(x), = = = h(y) y x h(y) 6 g(x) 3 3 6

8.2

CASO DISCRETO TRIVARIADO

Las definiciones para distribuciones bivariadas pueden extenderse a ms variables. El siguiente ejemplo es una referencia para los conceptos relacionados Ejemplo Sea V un vector aleatorio discreto cuyos componentes son las variables aleatorias X, Y, Z con distribucin de probabilidad conjunta kx 2 (y z);x = 1,2,3;y = 3,4;z = 1,2 f(x, y,z) = para el resto de x,y,z 0; a) Tabule f(x,y,z) para todos los valores de los componentes Primero debe determinarse k con la propiedad de las funciones de probabilidad:
3 4 2

f(x, y,z) = 1
x =1 y = 3 z =1 3 4 2

kx
x =1 y = 3 z =1

(y z) = k x 2 (y z) =k(14)(8) = 1 k = 1/112
x =1 y = 3 z =1

Entonces la distribucin conjunta es: 1 2 x (y z);x = 1,2,3;y = 3,4;z = 1,2 f(x, y, z) = 112 0; para el resto de x,y,z

144

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Tabulacin x 1 1 1 1 2 2 2 2 3 3 3 3 y 3 3 4 4 3 3 4 4 3 3 4 4 z 1 2 1 2 1 2 1 2 1 2 1 2 f(x,y,z) 2/112 1/112 3/112 2/112 8/112 4/112 12/112 8/112 18/112 9/112 27/112 18/112

b) Encuentre las distribuciones marginales univariadas Analticamente, dando por entendido el dominio de cada funcin 4 2 4 2 1 2 1 2 4 2 8 2 f(x) = f(x, y,z) = x (y z) = x (y z) = x 112 y = 3 z =1 112 y = 3 z =1 y = 3 z = 1 112

1 3 2 2 1 14 x (y z) = (14)(y 1 + y 2) = (2y 3) 112 112 112 x =1 z =1 x =1 z =1 3 4 1 2 1 3 2 4 14 f(z) = x (y z) = x (y z) = (2z + 7) 112 112 112 x =1 y = 3 x =1 y= 3 Tabularmente, sumando el contenido de la tabla de la distribucin conjunta f(y) =

112 x

(y z) =

x f(x) y f(y) z f(z)

1 8/112 3 42/112 1 70/112

2 32/112 4 70/112 2 42/112

3 72/112

c) Encuentre las distribuciones marginales bivariadas Analticamente, dando por entendido el dominio de cada funcin 2 2 1 2 1 2 2 x2 f(x, y) = f(x, y,z) = x (y z) = x (y z) = (2y 3) 112 z = 1 112 z =1 z = 1 112
f(x, z) =

f(x, y, z) =
y=3

1 2 1 2 4 x2 = = x (y z) x (y z) (2z + 7) 112 y = 3 112 y = 3 112


4

3 1 14 (y z) x 2 = (y z) 112 112 x =1 x =1 x =1 Tabularmente, sumando el contenido de la tabla de la distribucin conjunta f(x,y) x 1 2 3 y 3/112 12/112 27/112 3 5/112 20/112 45/112 4 f(x,z) x 1 2 3 z 5/112 20/112 45/112 1 3/112 12/112 27/112 2

f(y,z) =

f(x, y,z) = 112 x

(y z) =

145

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

f(y,z) y z 1 2 3 28/112 14/112 4 42/112 28/112

Se puede observar, analticamente o tabularmente, que f(x,y) = f(x) f(y) f(x,z) = f(x) f(z) f(y,z) f(y) f(z) Entonces, X, Y son variables aleatorias estadsticamente independientes X, Z son variables aleatorias estadsticamente independientes Y, Z son variables aleatorias estadsticamente no independientes d) Encuentre las distribuciones condicionales Analticamente, dando por entendido el dominio de cada funcin x2 (2y 3) f(x, y) 112 x 2 8x 2 f(X = x | Y = y) = f(x | y) = = = = 14 f(y) 14 112 (2y 3) 112 f(x|y) = f(x) pues X, Y son estadsticamente independientes Tambin se puede verificar que f(x|z) = f(x) pues X, Z son estadsticamente independientes Mientras que para f(y| z), se debe encontrar la relacin 14 (y z) f(y,z) yz 112 f(y | z) = = = 14 f(z) 2z + 7 (2z + 7) 112 Tabularmente y 3 4 f(y|z=1) 2/5 3/5 f(y|z=2) 1/3 2/3

EJERCICIOS
Si la distribucin de probabilidad conjunta de las variables aleatorias discretas X, Y est dada por 1 f(x, y) = (x + y) , x=0, 1, 2, 3; y=0, 1, 2 30 a) Verifique que es una funcin de probabilidad b) Construya una tabla con todos los valores de probabilidad c) Obtenga tabularmente la distribucin marginal de X d) Exprese mediante una frmula la distribucin marginal de Y e) Obtenga la distribucin condicional de X dado que Y=1 f) Obtenga la distribucin condicional de Y dado que X=2 g) Determine si las dos variables aleatorias son estadsticamente independientes

146

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

8.3

CASO CONTINUO BIVARIADO

8.3.1 DENSIDAD DE PROBABILIDAD CONJUNTA


Definicin: Funcin de densidad de probabilidad conjunta Sean X, Y: variables aleatorias continuas. Su funcin de densidad de probabilidad conjunta se escribe f(x,y)

Esta funcin debe satisfacer las siguientes propiedades 1) f(x,y) 0, x, y


2)

f(x, y)dxdy = 1

La funcin de densidad de probabilidad conjunta puede usarse para calcular probabilidad 3) P(aXb, cYd) =

f (x, y)dxdy
c a

d b

La funcin de densidad de probabilidad de dos variables aleatorias continuas X, Y, es una superficie en el espacio. El volumen debajo de esta superficie sobre el plano X-Y es igual a 1. La probabilidad P(aXb, cYd) es igual a la porcin del volumen debajo de la superficie f(x,y) y sobre el rectngulo aXb, c Yd

8.3.2 DISTRIBUCIN DE PROBABILIDAD ACUMULADA CONJUNTA


Definicin: P(Xx, Yy) = F(x,y) =

f(u,v)dudv

y x

- x, y

147

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. Suponga que el tiempo semanal de mantenimiento de una mquina depende de dos variables aleatorias continuas medidas en horas: X: duracin del mantenimiento mecnico Y: duracin el mantenimiento elctrico Suponga que la densidad de probabilidad conjunta es 2 (x + 2y), 0 x, y 1 f(x,y) = 3 otros x, y 0, a) Verifique que f(x, y) es una funcin de densidad de probabilidad 1) f(x,y)0, x, y.

2)

f(x, y)dxdy = 1
f(x, y)dxdy = 2 2 (x + 2y)dxdy = (x + 2y)dxdy 3 300 00
1 11 11

2 x2 2 1 2 y [ + 2xy]1 [ + y2 ]1 0 dy = ( + 2y)dy = 0 =1 30 2 30 2 3 2

b) Calcule la probabilidad que en alguna semana, el mantenimiento mecnico dure menos de 15 minutos y el mantenimiento elctrico dure ms de 30 minutos P(X1/4, Y1/2) =

1 1/ 4

1/ 2 0

2 (x + 2y)dxdy = 13/96 3

8.3.3 DENSIDADES DE PROBABILIDAD MARGINAL


Cuando se estudian ms de una variable aleatoria en forma conjunta, puede ser de inters conocer la distribucin de probabilidad de las variables aleatorias individualmente. Estas funciones se denominan densidades marginales Definiciones: X,Y variables aleatorias continuas f(x,y) su funcin de densidad de probabilidad conjunta. Entonces,

Sean

g(x) = h(y) =

f(x, y)dy f(x, y)dx

Densidad de probabilidad marginal de X Densidad de probabilidad marginal de Y

Para cada variable la densidad marginal se obtiene integrando la funcin de probabilidad sobre la otra variable. Las densidades marginales g(x), h(y) son funciones de probabilidad de X, Y en forma separada. Estas funciones deben cumplir las propiedades respectivas. 1) g(x) 0, x,

h(y ) 0, y

2)

g(x)dx = 1 , h(y)dy = 1

Las densidades marginales pueden usarse para calcular probabilidad de cada variable.

148

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. En el problema del mantenimiento de la mquina, a) Encuentre las densidades marginales

g(x) =

f(x, y)dy =
f(x, y)dx =

3 (x + 2y)dy = 3 xy + y
0 1

2 1

2 0 = 3 (x + 1),
1

0x1

h(y) =

2 2 x2 1 4y 3 (x + 2y)dx = 3 2 + 2yx = 3 + 3 , 0 y 1 0 0

b) Calcule P(0.25X0.75)
0.75

P(0.25X0.75) =

0.75

g(x)dx =

0.25

2 (x + 1)dx = 0.5 3 0.25

8.3.4 DENSIDADES DE PROBABILIDAD CONDICIONAL


Cuando se estudian ms de una variable aleatoria en forma conjunta, puede ser de inters conocer la distribucin de probabilidad de cada variable aleatoria dado que la otra variable aleatoria toma un valor especfico. Estas funciones se denominan densidades condicionales. Recordemos la frmula de probabilidad condicional para eventos P(A|B) = P(AB)/P(B) Definamos los eventos A, B de la siguiente manera A: X=x B: Y=y Siendo X, Y variables aleatorias discretas con distribucin de probabilidad conjunta f(x,y), Entonces, P(X = x,Y = y) P(X=x|Y=y) = P(Y = y) Que se puede expresar con la notacin establecida para las distribuciones conjuntas: f(x, y) f(x|y) = h(y) La funcin f(x|y) tambin satisface las propiedades de las funciones de probabilidad Definiciones Sean X, Y variables aleatorias continuas f(x, y) densidad de probabilidad conjunta Entonces, f(x, y) Es la densidad condicional de X dado que Y=y f(x|y) = h(y) f(x, y) Es la densidad condicional de Y dado que X=x f(y|x) = g(x) Las densidades condicionales f(x|y), f(y|x) son funciones de probabilidad de X, Y. Estas funciones cumplen las propiedades establecidas y pueden usarse para calcular probabilidad condicional. 1) f(x|y) 0, x,

f(y|x) 0, y

2)

f(x | y)dx = 1 ,

f(y | x)dy = 1

149

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. En el problema del mantenimiento de la mquina, a) Encuentre la densidad condicional f(y|x) 2 (x + 2y) f(x, y) 3 x + 2y = = , 0 x, y 1 f(y|x) = 2 g(x) x+1 (x + 1) 3 b) Calcule la probabilidad que el mantenimiento elctrico Y dure menos de 15 minutos dado que el mantenimiento mecnico X dur 30 minutos
0.25

P(Y0.25|X=0.5) =

0.25

f(y | 0.5)dy =

0.5 + 2y dy =0.125 0.5 + 1

8.3.5 VARIABLES ALEATORIAS CONTINUAS INDEPENDIENTES


Definicin Se dice que X, Y son variables aleatorias continuas estadsticamente independientes si y solo si f(x,y) = g(x) h(y) en el dominio de X, Y Demostracin Sean X,Y variables aleatorias continuas y f(x,y) su densidad de probabilidad conjunta. La densidad condicional f(x|y) es: f(x, y) f(x|y) = h(y) Y la densidad marginal g(x) es:

g(x) =

f(x, y)dy f(x | y)h(y)dy

Sustituyendo la densidad condicional en la densidad marginal: g(x) =

Supongamos que f(x|y) no depende de y. Esto significa que la expresin f(x|y) no contendra a la variable y. Por lo tanto, puede salir del integral:

g(x) = f(x|y)

h(y)dy

Pero

h(y)dy = 1 ,

pues h(y) es tambin una funcin de densidad de probabilidad .

Entonces g(x) = f(x|y). Sustituyendo en la densidad condicional inicial se obtiene f(x,y) = g(x) h(y)

150

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo Sea [X, Y] un vector aleatorio bivariado cuya densidad de probabilidad conjunta es: f(x,y) = kxy, 0 x, y 1, cero para otro (x,y) a) Encuentre el valor de k para que sea una funcin de probabilidad El dominio: 0 x, y 1 es equivalente a: 0 x 1, 0 y 1 Se debe cumplir que

0 0 kxydxdy = 1
1

1 1

kxydxdy = k y[ ]0dy = ydy = [ ]0 = = 1 k = 4 0 0 0 2 2 0 2 2 4


1 1

1 1

x2

k y2

f(x,y) = 4xy, 0 x, y 1, cero para otro (x,y) b) Calcule la probabilidad P(X < 0.5, Y > 0.75) P(X < 0.5, Y > 0.75) =

0.75 0

0.5

4xydxdy = 4

1 0.75

y[

x 2 0.5 1 1 ]0 dy = ydy = 0.1094 2 2 0.75

c) Encuentre las densidades marginales

g(x) = h(y) =

0 f(x, y)dy = 0 4xydy = 4x[ 2 ]0 = 2x,


1

y2

0x1 0 y1

f(x, y)dx = 4xydx = 4y[


0

x2 1 ]0 = 2y, 2

d) Determine si X, Y son variables aleatorias independientes Se debe cumplir que f(x,y) = f(x)f(y) para todo (x,y) f(x,y) = 4xy, g(x)h(y) = (2x)(2y) = 4xy = f(x, y)

X, Y son independientes

e) Encuentre las densidades condicionales f(x|y) = f(x,y)/f(y) = 4xy/2y=2x = g(x) Resultado previsto pues X,Y son independientes 0x1 f(y|x) = f(x,y)/f(x)=4xy/2x=2y = h(y) 0 y 1 Resultado previsto pues X,Y son independientes

Ejemplo Sea [X, Y] un vector aleatorio bivariado cuya densidad de probabilidad conjunta es: f(x,y) = kxy, 0 x y 1, cero para otro (x,y) a) Encuentre el valor de k para que f(x, y) sea una funcin de probabilidad El dominio: 0 x y 1 es equivalente a: 0 x y, 0 y 1 Se debe cumplir que

0 0 kxydxdy = 1
1 0

1 y

0 0

1 y

kxydxdy = k y[

x2 y k 1 k y4 k ]0 dy = y3dy = [ ]1 = 1 k = 8 0 = 2 2 0 2 4 8

f(x,y) = 8xy, 0 x y 1, cero para otro (x,y) b) Encuentre las densidades marginales
y2 1 ]x = 4(x x 3 ), x x 2 y y x2 y f(y) = f(x, y)dx = 8xydx = 8y[ ]0 = 4y3 , 0 0 2 f(x) =
1

f(x, y)dy = 8xydy = 8x[

0x1 0 y1

151

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

c) Determine si X, Y son variables aleatorias independientes Se debe cumplir que f(x,y) = f(x)f(y) para todo (x,y) f(x,y) = 8xy, f(x)f(y) = 4(x x3)(4y3) 8xy X, Y no son independientes

c) Encuentre las densidades condicionales 8xy 2x 0 x y 1, f(y) 0 f(x|y) = f(x,y)/f(y) = 3 = 2 , 4y y 8xy 2y = f(y|x) = f(x,y)/f(x) = , 0 x y 1, f(x) 0 4(x x 3 ) 1 x 2

8.4

CASO CONTINUO TRIVARIADO

Las definiciones para distribuciones bivariadas pueden extenderse a ms variables. El siguiente ejemplo es una referencia para revisar los conceptos relacionados Ejemplo Sea [X, Y, Z] un vector aleatorio trivariado cuya distribucin de probabilidad conjunta es: f(x,y,z) = kx(y+z), 0 < x < 2, 0 < y < z < 1, cero para otro (x,y,z) a) Encuentre el valor de k para que f(x, y, z) sea una funcin de probabilidad El dominio: 0 < y < z < 1 es equivalente a: 0 < y < z, 0 < z < 1 Se debe cumplir que

0 0 0 kx(y + z)dydzdx = 1
2 1 z 0 0 0

2 1 z

0 0 0
2

2 1 z

kx(y + z)dydzdx = k x
1

(y + z)dydzdx =k x [
0 0

y2 + yz]3 0 dzdx 2

2 2 1 z y2 3k 2 1 2 + yz]3 dzdx = k x ( + z2 )dzdx = x z dzdx 0 0 0 2 0 0 2 2 0 0 3k 2 z3 1 k 2 k x2 k 4 = x[ ]0 dx = xdx = [ ]2 ( )=1 k=1 0 = 0 0 2 3 2 2 2 2 2

= k x [

f(x,y,z) = x(y+z), 0 < x < 2, 0 < y < z < 1, cero para otro (x,y,z) b) Encuentre las distribuciones marginales univariadas

f(x) =

0 0 x(y + z)dydz =x 0 0 (y + z)dydz =x 0 [ 2


1

1 z

1 z

y2

z + yz]0 dz

z2 3x 1 2 3x z3 1 3x 1 x + z2 )dz = z dz = [ ]0 = ( )= , 0<x<2 0 2 0 2 2 3 2 3 2 2 1 2 1 2 1 x f(y) = x(y + z)dxdz = (y + z) xdxdz = (y + z)[ ]2 0 dz y 0 y 0 y 2 1 z2 2 = 2 (y + z)dz = 2[yz + ]1 0< y<1 y = 1 + 2y 3y , y 2 2 z 2 z 2 y2 z f(z) = x(y + z)dydx = x (y + z)dydx = x[ + zy]0 dx 0 0 0 0 0 2 3 2 3 x2 2 = xz2dx = z2 [ ]2 0<z<1 0 = 3z , 2 0 2 2 = x (

152

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

b) Encuentre las distribuciones marginales bivariadas

f(x, y) =

x(y + z)dz = x[yz +

z2 1 1 y2 x ]y = x(y + y2 = (1 + 2y 3y2 ) 2 2 2 2 0 < x < 2, 0 < y < 1

f(x,z) =

y2 z2 3xz2 z 2 + zy] = x( + z ) = , 0 < x < 2, 0 < z < 1 0 0 2 2 2 2 x2 f(y,z) = x(y + z)dx = (y + z)[ ]2 0<y<z<1 0 = 2(y + z), 0 2
z

x(y + z)dy = x[

c) Determine si X, Y, Z son variables aleatorias estadsticamente independientes x f(x, y) = (1 + 2y 3y2 ) = f(x)f(y) X, Y son independientes 2 3xz2 f(x,z) = = f(x)f(z) X, Z son independientes 2 f(y,z) = 2(y + z)

f(y)f(z) = (1 + 2y 3y2 )(3z2 ) f(y,z)

Y, Z no son independientes

d) Verifique que f(x) es una funcin de densidad de probabilidad 2x 1 x 2 2 1 22 dx = [ ]0 = ( ) = 1 0 2 2 2 2 2 e) Verifique que f(x, z) es una funcin de densidad de probabilidad 2 2 1 3xz 3 2 1 2 3 2 z3 1 1 2 1 x2 2 dzdx = x z dzdx = x[ ] dx = xdx = [ ]0 = 1 0 0 0 2 2 0 0 2 0 3 2 0 2 2

EJERCICIOS
1) X1 y X2 tienen la funcin de densidad de probabilidad conjunta dada por kx x , 0 x1 1, 0 x 2 1 f(x1, x 2 ) = 1 2 0, para otros puntos a) Calcule el valor de k que hace que f sea una funcin de densidad de probabilidad b) Calcule P(X10.75, X20.5) 2) X1 y X2 tienen la funcin de densidad de probabilidad conjunta dada por k(1 x 2 ), 0 x1 x 2 1 f(x1,x 2 ) = 0, para otros puntos a) Calcule el valor de k que hace que f sea una funcin de densidad de probabilidad b) Calcule P(X10.75, X20.5) 3) Si la densidad de probabilidad conjunta de las variables aleatorias continuas X, Y est dada por 1 (2x + y), 0<x<1, 0<y<2 f(x, y) = 4 0, para otros valores a) Verifique que es una funcin de densidad de probabilidad b) Obtenga la densidad marginal de X c) Obtenga la densidad marginal de Y d) Obtenga la densidad condicional de X dado que Y=1 e) Obtenga la densidad condicional de Y dado que X=1/4 f) Determine si X, Y son variables aleatorias estadsticamente independientes

153

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Manejo simblico de una distribucin trivariada continua (comparar con el ejemplo) >> syms x y z Definicin de variables simblicas X, Y, Z >> f=x*(y+z); Funcin de densidad trivariada f(x,y,z) >> p=int(int(int(f,y,0,z),z,0,1), x,0,2) Verificar que f es funcin de densidad p= 1 >> p=int(int(int(f,y,0.1,0.4),z,0.5,0.8), x,1.2,1.8) Calcular P(0.1<Y<0.4, 0.5<Z<0.8,1.2<Z<1.8) p= 729/10000 >> fx=int(int(f,y,0,z),z,0,1) fx = 1/2*x >> fy=int(int(f,x,0,2),z,y,1) fy = 2*y*(1-y)+1-y^2 >> fy=expand(fy) fy = 2*y-3*y^2+1 >> fz=int(int(f,y,0,z),x,0,2) fz = 3*z^2 >> fxy=int(f,z,y,1) fxy = x*y*(1-y)+1/2*x*(1-y^2) >> fxy=expand(fxy) fxy = x*y-3/2*x*y^2+1/2*x >> fxz=int(f,y,0,z) fxz = 3/2*x*z^2 >> fyz=int(f,x,0,2) fyz = 2*y+2*z >> r=expand(fxy)==expand(fx*fy) r= 1 >> r=expand(fxz)==expand(fx*fz) r= 1 >> r=expand(fyz)==expand(fy*fz) r= 0 >> p=int(fx, 1.2, 1.8) p= 9/20 >> p=int(int(fxy, x, 1.2, 1.8),y,0.2, 0.8) p= 783/2500 Densidad marginal f(x)

Densidad marginal f(y)

Expansin algebraica

Densidad marginal f(z)

Densidad marginal f(x,y)

Densidad marginal f(x,z)

Densidad marginal f(y,z)

Verificar que X, Y son variables independientes

Verificar que X, Z son variables independientes Verificar que Y, Z no son var. independientes

Calcular la marginal P(1.2<X<1.8)

Calcular la marginal P(1.2<X<1.8, 0.2<Y<0.8)

154

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

8.5

DISTRIBUCIN MULTINOMIAL

Es una generalizacin de la distribucin binomial. Se presenta cuando los resultados de cada ensayo tienen ms de dos resultados posibles. Se supondr que los ensayos son independientes y que la probabilidad se mantiene constante para cada tipo de resultado. Definicin: Distribucin multinomial Sean n: cantidad de ensayos realizados k: cantidad de resultados diferentes que se pueden obtener en cada ensayo

Sean las variables aleatorias discretas: X1: Cantidad de resultados de tipo 1 X2: Cantidad de resultados de tipo 2 ... Xk : Cantidad de resultados de tipo k Tales que x1 + x2 + . . . + xk = n Sean las probabilidades correspondientes a cada tipo de resultado p1: Probabilidad que el resultado sea de tipo 1 p2: Probabilidad que el resultado sea de tipo 2 ... pk: Probabilidad que el resultado sea de tipo k Tales que p1 + p2 + . . . + pk = 1 Las variables aleatorias X1, X2, . . . Xk tienen distribucin multinomial. Entonces, la distribucin de probabilidad de X1, X2, . . . Xk est dada por la funcin:

n x1 x 2 n! xk x x x f(x1,x 2 ,...,xk ) = p 1 p 2 ... pk k p1 p2 ... pk = x1 !x1 !...xk ! 1 2 x1,x 2 ,...,xk x1, x2, . . . , xk = 0, 1, 2, . . . ,n; x1+ x2 + . . . + xk = n Demostracin Siendo ensayos independientes, la probabilidad de tener x1 resultados de tipo 1, x2 n x x x resultados de tipo 2, ..., xk resultados de tipo k, es p1 1 p2 2 ... pk k . Pero existen x ,x ,..., x k 1 2 formas diferentes de obtener estos resultados, por lo tanto, esta cantidad es un factor.

8.5.1 MEDIA Y VARIANZA PARA LA DISTRIBUCIN MULTINOMIAL


Se puede calcular la media y varianza de cada variable aleatoria considerando a las dems variables aleatorias como otra variable:

Definicin
Sea Xi cualquiera de las variables discretas de la distribucin binomal Entonces X = E(Xi ) = npi Media de Xi
i

Varianza de Xi

2 Xi

= V(Xi ) = np i (1 pi ), i=1,2,...,k

Ejemplo Cada artculo producido por una fbrica puede ser aceptable, regular o defectuoso, con probabilidad 0.85, 0.10, y 0.05 respectivamente. Si se toman 5 artculos para examinarlos, calcule la probabilidad que 4 sean aceptables, 1 sea regular y ninguno defectuoso

155

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Es un experimento multinomial con n=5 Cantidad de artculos tomados para examinar X1: Cantidad de artculos aceptables X2: Cantidad de artculos regulares X3: Cantidad de artculos defectuosos p1=0.85 Probabilidad que un artculo sea aceptable p2=0.10 Probabilidad que un artculo sea regular p3=0.05 Probabilidad que un artculo sea defectuoso La distribucin de probabilidad para este experimento es: 5 x1 x 2 x 3 5! x x x f(x1,x 2 ,x 3 ) = p1 1 p2 2 p3 3 p1 p2 p3 = x ,x ,x x !x !x ! 1 2 3 1 1 3 x1, x2, x3 = 0, 1, 2, 4, 5; x1 + x2 + x3 = 5 Entonces
5 5! 4 1 0 P(X1=4, X2=1, X3=0) = f(4,1,0) = 0.85 4 0.1010.050 0.85 0.10 0.05 = 4,1,0 4!1!0! = 0.261

NOTA. Este problema puede reducirse a dos variables definiendo X3 = 5 X1 X2 mientras que p3 = 1 (p1 + p2) con lo cual, la distribucin de probabilidad es: 5 x1 x 2 5 x x f(x1,x 2 ) = p1 p2 (1 p1 p2 ) 1 2 x1,x2 , 5 x 1 x 2 x1, x2 = 0, 1, 2, 4, 5; x1 + x2 5; x3 = 5 x1 x2

8.6

DISTRIBUCIN HIPERGEOMTRICA MULTIVARIADA

Esta distribucin es una generalizacin de la distribucin hipergeomtrica. Se aplica a experimentos de muestreo sin reemplazo de una poblacin finita en la que hay objetos de ms de dos tipos diferentes. Esto implica que los objetos tomados no son devueltos a la poblacin. Por lo tanto la cantidad de objetos en el conjunto cambia.

Definicin: Distribucin hipergeomtrica multivariada N: Cantidad de objetos en un conjunto en el que existen k diferentes tipos. C1: Cantidad de objetos de tipo 1 en el conjunto C2: Cantidad de objetos de tipo 2 en el conjunto ... Ck: Cantidad de objetos de tipo k en el conjunto Tales que C1 + C2 + . . . + Ck = N
Sean Sea n Cantidad de objetos que se han tomado en la muestra Sean las variables aleatorias discretas: X1: Cantidad de objetos de tipo 1 X2: Cantidad de objetos de tipo 2 ... Xk : Cantidad de objetos de tipo k Tales que x1 + x2 + . . . + xk = n Entonces, la distribucin de probabilidad de X1, X2, . . . Xk est dada por la funcin: C1 C2 Ck ... x x xk f(x1,x 2 ,..., xk ) = 1 2 N n

x1, x2, . . ., xk = 0, 1, . . ., n; x1 + x2 + . . . + xk = n; C1 + C2 + . . . + Ck = N

156

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Demostracin C1 Se tienen formas diferentes de tomar x1 objetos de tipo 1 de los C1 disponibles x1


C2 Se tienen formas diferentes de tomar x2 objetos de tipo 2 de los C2 disponibles x2 ... Ck Se tienen formas diferentes de tomar xk objetos de tipo k de los Ck disponibles xk
N Adems hay formas diferentes de tomar n objetos de los N existentes en la poblacin n La frmula se obtiene aplicando el principio fundamental del conteo y la asignacn clsica de probabilidad

Ejemplo Una caja contiene 4 bateras en buen estado, 3 bateras en regular estado, y 2 bateras defectuosas. De esta caja se toma una muestra aleatoria de dos bateras. a) Encuentre la distribucin de probabilidad conjunta. Sean las variables aleatorias discretas X: Cantidad de bateras aceptables en la muestra Y: Cantidad de bateras en regular estado en la muestra Z: Cantidad de bateras defectuosas en la muestra.
Es un experimento hipergeomtrico. Entonces, la distribucin de probabilidad conjunta es 4 3 2 x y z P(X=x, Y=y, Z=z) = f(x,y,z) = , x, y, z = 0,1,2; x+y+z=2 9 2 b) Calcule la probabilidad de obtener una en buen estado y una defectuosa 4 3 2 1 0 1 P(X=1, Y=0, Z=1) = f(1,0,1) = = 0.2222 9 2 NOTA. Este problema puede reducirse a dos variables definiendo Z = 2 X Y Con esta sustitucin, la distribucin de probabilidad es: 2 4 3 x y 2 x y P(X=x, Y=y) = f(x,y) = , x, y = 0,1,2; x+y 2 9 2 c) Calcule la probabilidad de obtener una en buen estado y una defectuosa 2 43 1 0 2 1 0 P(X=1, Y=0) = f(1,0) = = 0.2222 9 2 d) Calcule P(X=0) La probabilidad de una variable es la distribucin marginal

P(X=0) = g(0) = f(0, y) =f(0,0)+f(0,1)+f(0,2) = 0.2778


y=0

157

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

e) Obtenga una frmula para la distribucin marginal g(x) Separamos las variables en dos grupos: X y las dems: 2 x 4 5 x 2 x g(x) = , x=0, 1, 2 9 2 f) Calcule P(X=0) con la distribucin marginal g(x) 4 5 02 0 = 0.2778 P(X=0) = g(0) = 9 2 g) Encuentre la distribucin condicional de X dado que Y = 1 f(x|1) = f(x,1)/h(1) h(1) = f(x,1) =f(0,1)+f(1,1)+f(2,1) = 0.5
x=0 2

f(x|1) =

f(x,1) 0.5

h) Calcule la probabilidad que al tomar la segunda batera, sta sea aceptable dado que la primera fue una batera en estado regular Y = 1 f(1,1) 0.3333 P(X=1|Y=1) = = =0.6667 0.5 0.5

EJERCICIOS
1) El una ciudad, 60% de los empleados viaja a su trabajo en bus, 25% lo hace en su auto, 10% usa bicicleta y 5% camina. Encuentre la probabilidad que en una muestra de 8 empleados, 5 usen bus, 2 usen su auto, 1 camine y ninguno use bicicleta. 2) De acuerdo con la teora de la gentica, un cierto cruce de conejillos de indias resultara en una descendencia roja, negra y blanca en la relacin 8:4:4. Encuentre la probabilidad de que de 10 descendientes, 6 sean rojos, 3 negros y 1 blanco. 3) Un frasco contiene 25 pastillas de igual forma y color. 15 son laxantes, siete son calmantes y tres son vitaminas. Si se eligen al azar cinco de estas pastillas, calcule la probabilidad de obtener
a) Cuatro laxantes y un calmante b) Dos laxantes, un calmante y dos vitaminas.

4) Un club de estudiantes tiene en su lista a 3 serranos, 2 amaznicos, 5 costeos y 2 insulares. Si se selecciona aleatoriamente un comit de 4 estudiantes encuentre la probabilidad de que:
a) Estn representadas todas las regiones del pas. b) Estn representadas todas las nacionalidades excepto la amazona.

158

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

8.7

MEDIA PARA VARIABLES ALEATORIAS CONJUNTAS BIVARIADAS


X, Y variables aleatorias discretas (o continuas) f(x, y) distribucin (o densidad) de probabilidad conjunta G(X,Y), alguna expresin con X, Y.

Definicin Sean

Sea

Si X, Y son variables aleatorias discretas La media o valor esperado de G(X,Y), se define G(X,Y) = E [ G(X,Y)] = G(x, y)f(x, y) Si X, Y son variables aleatorias continuas La media o valor esperado de G(X,Y), se define
G(X,Y) = E [ G(X,Y)] =

G(x, y)f(x, y)dxdy

Ejemplo Sean X, Y variables aleatorias discretas cuya funcin de distribucin de probabilidad conjunta 1 es f(x,y) = xy, x=1, 2, 3; y =1, 2 18 Calcule la media de la suma X + Y G(X,Y) = X+Y;
3 2 3 2

E[G(X,Y)] = E(X + Y) = =
3

x =1 y =1

(x + y) 18xy = 18 x (x + y)y
x = 1 y =1

1 1 x[(x + 1)1 + (x + 2)2] = [1(2 + 6) + 2(3 + 8) + 3(4 + 10)] = 4 18 x =1 18

Ejemplo Sean X, Y variables aleatorias continuas cuya funcin de densidad de probabilidad conjunta es 2 f(x,y) = (x + 2y) , 0 x, y 1 3 Calcule la media de la suma X + Y: G(X,Y) = X+Y E[G(X,Y)] = E(X + Y) =
11 11

(x + y)f(x, y)dxdy =
00

(x + y) 3 (x + 2y)dxdy = 7/6
00

159

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

8.7.1 CASOS ESPECIALES


Definicin Sean X, Y Variables aleatorias discretas (o continuas) f(x, y) Distribucin (o densidad) de probabilidad conjunta g(x), h(y) Distribuciones (o densidades) marginales de X y Y respectivamente

Si X, Y son variables aleatorias discretas Si G(X,Y) = X, entonces su media es X = E(X) = xf(x, y) = x f(x, y) =
X Y x y

x g(x)
x

Si G(X,Y) = Y, entonces su media es Y = E(Y) = yf(x, y) = y f(x, y) =


X Y y x

y h(y)
y

Si X, Y son variables aleatorias continuas Si G(X,Y) = X, entonces su media es

X = E(X) =

Si G(X,Y) = Y, entonces su media es

x g(x)dx y h(y)dy

Y = E(Y) =

8.8

COVARIANZA PARA VARIABLES ALEATORIAS CONJUNTAS BIVARIADAS

La definicin de varianza se extiende a variables aleatorias conjuntas y se denomina covarianza. Es una medida de la dispersin combinada de ambas variables. Definicin: Covarianza Sean X, Y variables aleatorias discretas con distribucin conjunta f(x,y) Entonces, la covarianza de X, Y es XY = Cov(X,Y) = E [ (X X )(Y Y )] = (x X )(y Y )f(x, y)
x y

Sean X, Y variables aleatorias continuas con densidad conjunta f(x,y) Entonces, la covarianza de X, Y es
XY = Cov(X,Y) = E [ (X X )(Y Y )] =

(x X )(y Y )f(x, y)dxdy

La siguiente frmula es equivalente a la anterior y es de uso comn para calcular la covarianza: Definicin: Frmula alterna para la covarianza

XY = Cov(X,Y) = E(XY) X Y para variables aleatorias discretas o continuas


Demostracin Cov(X,Y) = E[(XX)(YY)] = E[XY XY YX + XY] = E(XY) YE(X) XE(Y) + XY = E(XY) YX XY + XY = E(XY) XY Si X = Y, la covarianza se reduce a la varianza

2 X = V(X) = E[(X X ) ] = E(X ) X

160

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo Sean X, Y variables aleatorias discretas cuya funcin de distribucin de probabilidad conjunta 1 xy, x=1, 2, 3; y=1, 2 es f(x,y) = 18 Encuentre la covarianza entre X, Y Para usar la frmula de la covarianza: XY = Cov(X,Y) = E(XY) XY Se necesitan las distribuciones marginales 2 1 x 2 x x g(x) = f(x, y) = xy = y = 18 (1 + 2) = 6 , 18 18 y y =1 y =1

x = 1, 2, 3

h(y) =
Entonces

f(x, y) =
x 3

1 y 3 y y xy x= (1 + 2 + 3) = , = 18 18 x =1 18 3 x =1
3

y = 1, 2

X = E(X) =
Y = E(Y) =

x =1 2
y =1

xg(x) = x 6 = 6 x2 = 6 (12 + 22 + 32 ) = 3
x =1 2

yh(y) = y 3 = 3 y2 = 3 (12 + 22 ) = 3
y =1
3

x =1 2

y =1

Adems

E(XY) =

xy 18 xy = 18 x y
2 x =1 y =1 x =1 y =1

1 3 2 2 1 2 70 x [1 + 22 ] = [1 (5) + 22 (5) + 32 (5)] = 18 x = 1 18 18

Sustituyendo XY = Cov(X,Y) = E(XY) XY = 70/18 (7/3)(5/3) = 0

Ejemplo Sean X, Y variables aleatorias continuas cuya funcin de densidad de probabilidad conjunta es 2 f(x,y) = (x + 2y) , 0 x, y 1 3 Encuentre la covarianza entre X, Y
Para usar la frmula de la covarianza: XY = Cov(X,Y) = E(XY) XY Se necesitan las distribuciones marginales
g(x) =
1 1

3 (x + 2y)dy = 3 (x + 1) ,
0 1 1

h(y) =

3 (x + 2y)dx = 3 (1 + 4y)
0

Entonces
2 5 X = E(X) = xg(x)dx = x (x + 1)dx = 3 9 0 0 1 11 Y = E(Y) = yh(y)dy = y (1 + 4y)dy = 3 18 0 0
1 1

Adems
E(XY) =

xyf(x, y)dxdy = xy 3 (x + 2y)dxdy = 3


00 00

11

11

Sustituyendo

XY = Cov(X,Y) = E(XY) XY = 1/3 (5/9)(11/18) = 1/162 161

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

8.8.1 SIGNOS DE LA COVARIANZA


La covarianza es una medida del nivel de relacin entre las variables aleatorias X, Y. La covarianza tiene significado si la relacin entre las variables aleatorias es lineal.

a) Si valores grandes de X estn asociados probabilsticamente con valores grandes de Y, o si valores pequeos de X estn asociados probabilsticamente con valores pequeos de Y entonces la covarianza tiene signo positivo. b) Si valores grandes de X estn asociados probabilsticamente con valores pequeos de Y, o si valores pequeos de X estn asociados probabilsticamente con valores grandes de Y entonces la covarianza tiene signo negativo.
Para entender este comportamiento debemos referirnos a la definicin de covarianza: Cov(X,Y) = E [ (X X )(Y Y )] = (x X )(y Y )f(x, y)
x y

Si los valores de X y Y son ambos mayores o ambos menores con respecto a su media, el producto de las diferencias (x X )(y Y ) tendr signo positivo. Si estos trminos tienen mayor peso de probabilidad entonces la suma tendr signo positivo. En los casos contrarios la suma tendr signo negativo. Esta relacin se puede visualizar como la pendiente de una recta que relaciona X y Y.

c) Si X, Y son variables aleatorias estadsticamente independientes, entonces Cov[X,Y]=0 Demostracin


Si X, Y son variables aleatorias estadsticamente independientes, se tiene que

f(x,y) = g(x) h(y).


Esto permite separar las sumatorias:

E(XY) =

xyf(x, y) = xyg(x)h(y) = xg(x) yh(y) = E(X) E(Y)


x y x y x y

Este resultado se sustituye en la frmula de la covarianza:

Cov(X,Y) = E(XY) XY = E(X)E(Y) XY = XY XY = 0 NOTA:


Si Cov(X,Y) = 0 esto no implica necesariamente que X, Y sean variables aleatorias independientes.

162

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo Sean X, Y variables aleatorias discretas cuya funcin de distribucin de probabilidad conjunta 1 xy, x=1, 2, 3; y=1, 2. es f(x,y) = 18
Demuestre con la propiedad anterior que Cov[X,Y] = 0

Solucin Se obtuvieron previamente las distribuciones marginales x g(x) = f(x, y) = , x = 1, 2, 3 6 y h(y) =


Se tiene que
1 xy, x=1, 2, 3; y=1, 2. 18 x y 1 xy , x=1, 2, 3; y=1, 2. g(x)h(y) = ( )( ) = 6 3 18 Se cumple que

f(x, y) = 3 ,
x

y = 1, 2

f(x,y) =

f(x,y) = g(x)h(y), x=1, 2, 3; y=1, 2.


Por lo tanto, X, Y son variables aleatorias estadsticamente independientes. En consecuencia

Cov(X,Y) = 0

Ejemplo Sean X, Y variables aleatorias continuas cuya funcin de densidad de probabilidad conjunta es 2 f(x,y) = (x + 2y) , 0 x, y 1 3 Demuestre con la propiedad anterior que Cov[X,Y] = 0 Solucin Se obtuvieron previamente las distribuciones marginales
g(x) =
h(y) =

3 (x + 2y)dy = 3 (x + 1) ,
3 (x + 2y)dx = 3 (1 + 4y)
0

0 1

Se tiene que
2 (x + 2y) , 0 x, y 1 3 2 1 2 g(x)h(y) = (x + 1) (1 + 4y) = (x + 1)(1 + 4y) 3 3 9 Se tiene que

f(x,y) =

f(x,y) g(x)h(y),
Por lo tanto, X, Y son variables aleatorias no estadsticamente independientes. En consecuencia

Cov(X,Y) 0

163

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

8.8.2 MATRIZ DE VARIANZAS Y COVARIANZAS


Es una representacin ordenada de las varianzas y covarianzas entre las variables aleatorias.

Definicin
Sean X y Y variables aleatorias conjuntas (discretas o continuas) 2 2 Varianzas X = V(X), Y = V(Y)

XY = YX = Cov(X, Y) = Cov(Y, X)
Entonces la matriz de varianzas y covarianzas es

Covarianzas

2 [ XY ] = X YX

XY 2 Y

Esta matriz es simtrica y contiene en la diagonal las varianzas de cada variable. Los otros componentes son las covarianzas entre las dos variables: XY = YX

Ejemplo Sean X, Y variables aleatorias discretas cuya funcin de distribucin de probabilidad conjunta 1 xy, x=1, 2, 3; y=1, 2 es f(x,y) = 18 Encuentre la matriz de varianzas y covarianzas
Se obtuvieron previamente las distribuciones marginales x g(x) = f(x, y) = , x = 1, 2, 3; 6 y

h(y) =

f(x, y) = 3 ,
x

y = 1, 2

Medias, varianzas y covarianzas

E(X) =
E(Y) =

x =1 2
y =1

xg(x) = 3
yh(y) = 3
x =1 2
y =1

E(X 2 ) =
E(Y 2 ) =

x2g(x) = x2 6 = 6 x3 = 6 (13 + 23 + 33 ) = 6
x =1 2

y2h(y) = y2 3 = 3 y3 = 3 (13 + 23 ) = 3
y =1
2

x =1 2

y =1

1 70 E(XY) = E(YX) = xy xy = 18 18 x =1 y =1 x y 1 g(x) h(y) = ( )( ) = xy = f(x,y), x = 1, 2, 3; y = 1, 2 18 6 3 X, Y son variables aleatorias independiente XY = Cov(X, Y) = 0
2 2 2 2 X = V(X) = E(X ) E (X) = 6 (7/3) = 5/9 2 2 2 2 Y = V(Y) = E(Y ) E (Y) = 3 (5/3) = 2/9

Matriz de varianzas - covarianzas 2 5 / 9 0 = [ XY ] = X XY 2 YX Y 0 2 / 9

164

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

8.8.3 COEFICIENTE DE CORRELACIN LINEAL


Es una medida normalizada de la relacin lineal entre dos variables aleatorias. Se puede demostrar que el coeficiente de correlacin reduce el rango de la covarianza al intervalo [-1, 1]

Definicin
Sean X, Y variables aleatorias conjuntas (discretas o continuas) entonces, el coeficiente de correlacin lineal de X, Y es:

XY =

Cov(X,Y) = XY , 1 XY 1 V(X) V(Y) X Y

8.8.4 MATRIZ DE CORRELACIN


Es una representacin ordenada de los valores de correlacin entre las variables aleatorias.

Definicin
Sean X y Y variables aleatorias conjuntas (discretas o continuas) Entonces la matriz de correlacin es

[ XY ] =

1
YX

XY 1

Esta matriz es simtrica y contiene el valor 1 en la diagonal. Los otros componentes son valores de correlacin entre las dos variables: XY = YX

Las definiciones anteriores pueden extenderse a ms variables aleatorias conjuntas Definiciones


Sean: X1, X2, . . . Xk ii = V(Xi) Variables aleatorias conjuntas (discretas o continuas) Varianza de la variable Xi Covarianza de las variables Xi, Xj Coeficiente de correlacin lineal entre las variables Xi, Xj

ij = Cov(Xi, Xj)

ij

Matriz de varianzas-covarianzas
11 12 21 22 i j = . . . . k1 k2 Matriz de correlacin
1 12 21 1 i j = . . . . k1 k2 . . 1k . . 2k . . . . . . . . 1

. . 1k . . 2k . . . . . . . . kk

165

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

8.9

MEDIA Y VARIANZA PARA VARIABLES ALEATORIAS CONJUNTAS TRIVARIADAS

Las definiciones para distribuciones bivariadas pueden extenderse a ms variables. Los siguientes ejemplos son referencias
Ejemplo con variables discretas Sea V un vector aleatorio discreto cuyos componentes son las variables aleatorias X, Y, Z, con distribucin de probabilidad conjunta 1 2 x (y z);x = 1,2,3;y = 3,4;z = 1,2 f(x, y, z) = 112 0; para el resto de x,y,z Encuentre la matriz de varianzas y covarianzas y la matriz de correlacin

Distribuciones marginales (se da por entendido el dominio de cada una) 4 2 4 2 1 2 1 2 4 2 8 2 f(x) = f(x, y,z) = x (y z) = x (y z) = x 112 y = 3 z =1 112 y = 3 z =1 y = 3 z = 1 112

f(y) =

1 3 2 2 1 14 x (y z) = (14)(y 1 + y 2) = (2y 3) 112 112 112 x =1 z =1 x =1 z =1 3 4 1 2 1 3 2 4 14 f(z) = x (y z) = x (y z) = (2z + 7) 112 x = 1 y = 3 112 x = 1 y = 3 112

112 x
2

(y z) =

f(x, y) =
f(x, z) =

f(x, y,z) = 112 x


z =1
4

(y z) =
(y z) =

z =1
4

1 2 2 x2 x (y z) = (2y 3) 112 z = 1 112


1 2 4 x2 x (y z) = (2z + 7) 112 y = 3 112

f(x, y, z) = 112 x
y=3 y=3

f(y,z) =

f(x, y,z) = 112 x


x =1

f(x,y) = f(x) f(y) f(x,z) = f(x) f(z) f(y,z) f(y) f(z)

3 1 14 (y z) x 2 = (y z) 112 112 x =1 x =1 X, Y son variables aleatorias independientes X, Z son variables aleatorias independientes Y, Z son variables aleatorias no independientes

(y z) =

Medias, varianzas y covarianzas 3 3 8 2 8 3 3 288 E(X) = xf(x) = x x = x = 112 112 x =1 x =1 x = 1 112

E(X2 ) =
E(Y) =

x =1
4

x2 f(x) =
4

x =1

x2

8 2 8 3 4 784 x = x = 112 112 112 x =1

y=3

yf(y) =
4 y=3

y=3

y
4

14 14 4 29 (2y 3) = y(2y 3) = 8 112 112 y = 3 14 14


2
4

E(Y 2 ) =

y2 f(y) = y2 112 (2y 3) = 112 y2 (2y 3) =


y=3 y=3

107 8

E(Z) =

z =1

zf(z) = z 112 (2z + 7) = 112 z(2z + 7) =


z =1 z =1 z =1 4 2

14

14

11 8

E(Z2 ) =
E(YZ) =

z2 f(z) =
y = 3 z =1

z =1

z2

14 14 2 2 17 (2z + 7) = z (2z + 7) = 8 112 112 z =1


14 4 2 560 yz(y z) = 112 112 y = 3 x =1

(yz)f(y, z) =

166

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2 2 2 X = V(X) = E(X ) E (X) =

784 288 2 ( ) = 83 / 196 112 112 107 29 2 15 2 2 2 ( ) = Y = V(Y) = E(Y ) E (Y) = 8 8 64 17 11 15 2 2 2 ( )2 = Z = V(Z) = E(Z ) E (Z) = 8 8 64

XY = YX = Cov(XY) = 0 XZ = ZX = Cov(XZ) = 0

Por ser variables aleatorias independientes Por ser variables aleatorias independientes
560 29 11 1 = 112 8 8 64

YZ = ZY = Cov(YZ) = E(YZ) E(Y)E(Z) =

Matriz de varianzas y covarianzas 2 XY XZ 83 / 196 0 0 X 2 15 / 64 1/ 64 [ ij ] = YX Y YZ = 0 2 0 1/ 64 15 / 6 4 ZX ZY Z

Coeficientes de correlacin Cov(X, Y) XY = = XY = 0 V(X) V(Y) X Y


XZ = YZ = Cov(X, Z) V(X) V(Z) Cov(Y,Z) V(Y) V(Z) = = XZ =0 X Y YZ = YZ 1/ 64 15 / 64 15 / 64 = 1 15

Matriz de correlacin 1 XY [i,j ] = 1 YX ZX ZY

XZ 1 0 0 1 1/ 15 YZ = 0 1 0 1/ 15 1

Ejemplo con variables continuas


Sea [X, Y, Z] un vector aleatorio trivariado cuya distribucin de probabilidad conjunta es: f(x,y,z) = x(y+z), 0 < x < 2, 0 < y < z < 1, cero para otro (x,y,z)

Encuentre la matriz de varianzas y covarianzas


Distribuciones marginales

y2 z + yz]0 dz 0 0 0 0 0 2 2 1 z 3x 1 2 3x z3 1 3x 1 x = x ( + z2 )dz = z dz = [ ]0 = ( )= , 0<x<2 0 2 2 2 0 2 3 2 3 2 1 2 1 2 1 x f(y) = x(y + z)dxdz = (y + z) xdxdz = (y + z)[ ]2 0 dz y 0 y 0 y 2 1 z2 2 = 2 (y + z)dz = 2[yz + ]1 0< y<1 y = 1 + 2y 3y , y 2 2 z 2 z 2 y2 z f(z) = x(y + z)dydx = x (y + z)dydx = x[ + zy]0 dx 0 0 0 0 0 2 3 2 3 x2 2 = xz2dx = z2 [ ]2 0<z<1 0 = 3z , 0 2 2 2 f(x) =
1 z

x(y + z)dydz =x

1 z

(y + z)dydz =x [

167

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

f(x, y) =

x(y + z)dz = x[yz +

z2 1 1 y2 x ]y = x(y + y2 = (1 + 2y 3y2 ) 2 2 2 2 0 < x < 2, 0 < y < 1

y2 z2 3xz2 z 2 + zy] = x( + z ) = , 0 < x < 2, 0 < z < 1 0 0 2 2 2 2 x2 f(y,z) = x(y + z)dx = (y + z)[ ]2 0< y<z<1 0 = 2(y + z), 0 2 x f(x, y) = (1 + 2y 3y2 ) = f(x)f(y) X, Y son independientes 2 3xz2 f(x,z) = = f(x)f(z) X, Z son independientes 2 f(y,z) = 2(y + z) f(x,z) =
z

x(y + z)dy = x[

f(y)f(z) = (1 + 2y 3y2 )(3z2 ) f(y,z)


Medias, varianzas y covarianzas
E(X) =

Y, Z no son independientes

0 xf(x)dx = 0 x( 2 )dx = 3 0 x
1 2 2

E(X 2 ) = E(Y) =

f(x)dx =
1

0 x 0 y

x ( )dx = 2 2
2

0 yf(y)dy = 0 y(1 + 2y 3y 0 y
1 1 2

)dy =

5 12 7 30

E(Y 2 ) = E(Z) =

f(y)dy =
1

1 2

(1 + 2y 3y2 )dy = )dz = 3 4 3 5

0 zf(z)dz = 0 z(3z 0 z
1 2

E(Z 2 ) =

f(z)dz =

0 z

1 2

(3z2 )dz =

E(YZ) = =

0 0

1 z

yz(2(y + z))dydz = 2

1 z 0 0

(y2 z + yz 2 )dydz = 2 [
0

y3 z y2 2 z + z ]0 dz 3 2

5 1 4 z dz = 1/ 3 3 0 2 2 2 2 X = V(X) = E(X ) E (X) = 2 (4 / 3) = 2 / 9


2 2 2 2 Y = V(Y) = E(Y ) E (Y) = 7 / 30 (5 / 12) = 43 / 720 2 2 2 2 Z = V(Z) = E(Z ) E (Z) = 3 / 5 (3 / 4) = 3 / 80

XY = Cov(XY) = 0 XZ YZ

Por ser variables aleatorias independientes Por ser variables aleatorias independientes = Cov(XZ) = 0 = Cov(Y,Z) = E(YZ) E(Y)E(Z) = 1/ 3 (5 / 12)(3 / 4) = 1/ 48
XY 2 Y ZY XZ 2 / 9 0 0 YZ = 0 43 / 720 1/ 48 0 1/ 48 3 / 80 2 Z

2 X [ ij ] = YX ZX

168

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) Si la distribucin de probabilidad conjunta de las variables aleatorias discretas X, Y est dada por 1 f(x, y) = (x + y) , x=0, 1, 2, 3; y=0, 1, 2 30 Encuentre la matriz de varianzas y covarianzas 2) Si la distribucin de probabilidad conjunta de las variables aleatorias discretas X, Y est dada por 1 (2x + y), 0<x<1, 0<y<1 f(x, y) = 4 0, para otros valores Encuentre la matriz de correlacin

MATLAB
Manejo simblico estadstico de media y varianza (Comparar con el ejemplo) Variables aleatorias discretas >> syms x y >> f=x*y/18; >> g=0; >> for y=1:2 g=g+eval(subs(f,'y',y)); end >> g g= 1/6*x >> syms x y >> h=0; >> for x=1:3 h=h+eval(subs(f,'x',x)); end >> h h= 1/3*y >> EX=0; >> for x=1:3 EX=EX+eval(x*g); end >> EX EX = 7/3 >> EY=0; >> for y=1:2 EY=EY+eval(y*h); end >> EY EY = 5/3 >> EX2=0; >> for x=1:3 EX2=EX2+eval(x^2*g); end >> EX2 EX2 = 6
Definicin de variables simblicas Distribucin de probabilidad conjunta (discreta) Obtencin de la distribucin marginal g(x)

Obtencin de la distribucin marginal h(y)

Obtencin de E(X)

Obtencin de E(Y)

Obtencin de E(X2)

169

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

>> EY2=0; >> for y=1:2 EY2=EY2+eval(y^2*h); end >> EY2 EY2 = 3 >> EXY=0; >> for x=1:3 for y=1:2 EXY=EXY+eval(x*y*f); end end >> EXY EXY = 35/9 >> sigma2X=EX2-EX^2 sigma2X = 5/9 >> sigma2Y=EY2-EY^2 sigma2Y = 2/9 >> CovXY=EXY-EX*EY CovXY = 8.8818e-016 Variables aleatorias continuas >> syms x y >> f=2/3*(x + 2*y); >> g=int(f,y,0,1) g= 2/3*x+2/3 >> h=int(f,x,0,1) h= 1/3+4/3*y >> EX=int(x*g,0,1) EX = 5/9 >> EY=int(y*h,0,1) EY = 11/18 >> EXY=int(int(x*y*f,x,0,1),y,0,1) EXY = 1/3 >> CovXY=EXY-EX*EY CovXY = -1/162 >> r=expand(f)==expand(g*h) r= 0

Obtencin de E(Y2)

Obtencin de E(XY)

Varianza de X

Varianza de Y

Covarianza de X, Y El resultado es aproximadamente cero

Definicin de variables simblicas Funcin de densidad conjunta f(x,y) Densidad marginal g(x)

Densidad marginal h(y)

Obtencin de E(X)

Obtencin de E(Y)

Obtencin de E(XY)

Covarianza de X,Y X, Y no son independientes Verificar que f(x,y) = g(x) h(y) No es verdad

170

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

8.10 PROPIEDADES DE LAS VARIABLES ALEATORIAS CONJUNTAS


En esta seccin se establecen algunas propiedades tiles que sern usadas posteriormente en el tema principal de esta unidad que es el estudio de las distribuciones de muestreo.

PROPIEDAD 1
Sean X1, X2 variables aleatorias (discretas o continuas) a1, a2 Y = a1 X1 + a2 X2, variable aleatoria que incluye a las variables X1 y X2

Entonces la media, o valor esperado de la variable Y es Y = E(Y) =E(a1 X1 + a2 X2) = a1 E(X1) + a2 E(X2) = a1 X + a2 X
1

Esta definicin se puede extender a expresiones con ms variables aleatorias:

Sea Entonces

Y = a1 X1 + a2 X2 + ... + an Xn , Y = a1 X1 + a2 x2 + ... + an Xn

(Xi: variables aleatorias)

PROPIEDAD 2
Sean X1, X2 variables aleatorias (discretas o continuas) a1, a2 Y = a1 X1 + a2 X2, variable aleatoria definida con las variables X1 y X2 Entonces la varianza de la variable aleatoria Y es 2 2 2 Y = V(Y) = a 1 V(X1) + a 2 V(X2) + 2 a1 a2 Cov(X1 X2) Si X1, X2 son variables aleatorias estadsticamente independientes Cov(X1X2) = 0 Entonces 2 2 2 2Y = a21 V(X1) + a22 V(X2) = a1 2 X1 + a 2 X2 Demostracin V(Y) = V(a1 X1 + a2 X2) = E[(a1 X1 + a2 X2)2] - E2(a1 X1 + a2 X2) = E(a21 X21 + 2 a1 a2 X1 X2 + a22 X22) [a1 E(X1) + a2 E(X2)]2 = a21 E(X21) + 2 a1 a2 E(X1 X2) + a22 E(X22) a21 E2(X1) 2 a1 a2 E(X1)E(X2) a22 E2(X22) = a21 E(X21) a21 E2(X1) + a22 E(X22) a22 E2(X22) + 2 a1 a2 E(X1 X2) 2 a1 a2 E(X1)E(X2) = a21 V(X1) + a22 V(X2) + 2 a1 a2 Cov(X1 X2) Esta propiedad se puede extender a expresiones con ms variables aleatorias:

Sea Entonces

Y = a1 X1 + a2 X2 + ... + an Xn ,
2 2 2 2 2 2 2 Y = a1 X 1 + a 2 X 2 + ... + an Xn

(Xi: variables aleatorias independientes)

171

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

PROPIEDAD 3
Sean X1, X2 variables aleatorias (discretas o continuas) a1, a2 Y = a1 X1 + a2 X2, una variable aleatoria definida con X1 y X2 Entonces la funcin generadora de momentos de la variable aleatoria Y es my(t) = ma 1 X 1 ( t ) ma 2 X 2 ( t ) Demostracin
X1 + a2 X 2 )t

mY(t) = E(eYt) = E[e(a

] = E(ea1 X1t ea2

X2 t

Si X1, X2 son variables aleatorias estadsticamente independientes E(ea1 X1t ea2 X2 t ) = E(ea1 X1t ) E(ea2 X2 t ) Por lo tanto

my(t) = ma 1 X 1 ( t ) ma 2 X 2 ( t )
Esta propiedad se puede extender a expresiones con ms variables aleatorias:

Sea Entonces

Y = a1 X1 + a2 X2 + ... + an Xn , (Xi : variables aleatorias independientes) mY(t) = ma 1 X 1 ( t ) ma 2 X 2 ( t ) . . . ma n X n ( t )

172

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

DISTRIBUCIONES DE MUESTREO

Este captulo se inicia con algunas definiciones y trminos relacionados con el estudio de la Estadstica Inferencial que constituye el componente ms importante de la Estadstica Una inferencia estadstica es una afirmacin que se hace acerca de algn parmetro de la poblacin utilizando la informacin contenida en una muestra tomada de esta poblacin. Debemos aceptar que por la naturaleza aleatoria de los datos obtenidos en la muestra, hay un riesgo en la certeza de la afirmacin propuesta, y es necesario establecer una medida para determinar la magnitud de este riesgo. Supongamos una poblacin de tamao N de la cual se toma una muestra de tamao n, obtenindose los siguientes resultados: x1, x2, ..., xn

Los n resultados obtenidos x1, x2, ..., xn son algunos de los posibles valores que se extraen de la poblacin cada vez que se toma una muestra de tamao n. Por lo tanto, podemos representarlos mediante n variables aleatorias: X1, X2, ..., Xn Definicin Muestra aleatoria: es el conjunto de n variables aleatorias X1, X2, ..., Xn tales que sean independientes y provengan de la misma poblacin, es decir que tengan la misma funcin de probabilidad.

Para que esta definicin sea vlida, N debe ser muy grande, o el muestreo debe realizarse con reemplazo. Adicionalmente, cada elemento de la poblacin debe tener la misma probabilidad de ser elegido. Definiciones Parmetro: es una medida estadstica poblacional, cuyo valor es de inters conocer Por ejemplo, la media poblacional Estadstico o estimador: es una variable aleatoria definida con las variables de la muestra aleatoria. Por ejemplo, la media muestral X Distribucin de muestreo de un Estadstico: Es la distribucin de probabilidad del estadstico

173

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

9.1

DISTRIBUCIN DE MUESTREO DE LA MEDIA MUESTRAL

En esta seccin se estudian las propiedades de la distribucin de probabilidad de la media muestral Definicin Sean X1, X2, ..., Xn una muestra aleatoria tomada de una poblacin con media y varianza , entonces, la media muestral es una variable aleatoria que se define con la siguiente frmula: 1 n X = Xi n i=1 Media de X : Varianza de X :
2

X = E(X) =
2 = V(X) = X 2 n

Demostracin 1 n 1 1 1 Xi = X1 + X 2 + ... + Xn n i=1 n n n Por las propiedades estudiadas anteriormente, si X1, X2, ..., Xn son variables aleatorias independientes, entonces 1 1 1 X = X1 + x2 + ... + Xn n n n 12 2 12 2 1 2 X = ( ) X1 + ( ) X2 + ... + ( )2 2 Xn n n n Adems, como las variables aleatorias provienen de la misma poblacin: x = E(Xi) = , i = 1, 2, 3, . . ., n
Media muestral:

X=

2 xi

= V(Xi) = ,

i = 1, 2, 3, . . ., n

Al sustituir en las frmulas anteriores y simplificar se completa la demostracin. La media o valor esperado X de la media muestral X debe entenderse como el valor que tomara la variable aleatoria X si se tomase una cantidad muy grande de muestras y se calculara su promedio. Entonces el resultado se acercara cada vez ms al valor de

Definicin: Media de la muestra tomada de una poblacin normal


Si la muestra proviene de una poblacin con distribucin normal con media y varianza , entonces la media muestral X tiene distribucin normal y su media y varianza son: X = Media: Varianza:
2

2 = X

2 n

Demostracin Se basa en la comparacin de la funcin generadora de momentos de una variable aleatoria con distribucin normal y la funcin generadora de momentos de la media muestral definida mediante el producto de las funciones generadoras de momentos de las variables aleatorias.

174

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

9.1.1 CORRECCIN DE LA VARIANZA


Si el tamao N de la poblacin es finito y este nmero no es muy grande con respecto al tamao n de la muestra, se debe usar la siguiente frmula para corregir la varianza muestral.

Correccin de la varianza:
Si n > 5%N, entonces:
2 = X 2 n Nn N1

Ejemplo Un fabricante especifica que la duracin de sus bateras tiene distribucin normal con media 36 meses y desviacin estndar 8 meses. Calcule la probabilidad que una muestra aleatoria de 9 bateras tenga una duracin no mayor a 30 meses.
Especificaciones para la poblacin X variable aleatoria continua (duracin en meses de cada batera) parmetro de inters (media poblacional) X tiene distribucin normal con = 36, 2 = 82 Datos de la muestra

1 n Xi , tamao de la muestra: n = 9 n i=1 Por la propiedad establecida anteriormente


Media muestral: X =

82 2 X tiene aproximadamente distribucin normal con X = = 36 y X = = = 7.1 9 n

La variable aleatoria y la media muestral tienen distribucin normal aproximadamente

P( X 30) = P( Z

X X X

) = P( Z

30 36 7.1

) = P(Z 2.6) = F( 2.6) = 0.0122 = 1.22%

La media o valor esperado de X es igual a la media poblacional , por lo tanto, cualquier valor de X , aunque aleatorio, debera estar razonablemente cerca de . El resultado obtenido indica que la probabilidad que la media muestral tenga un valor menor o igual a la media obtenida con los datos, es un valor muy pequeo. Esto podra interpretarse como un indicio de que lo afirmado por el fabricante no es verdadero.

175

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

9.2

TEOREMA DEL LMITE CENTRAL

El siguiente enunciado es uno de los ms importantes teoremas de la estadstica inferencial

Definicin: Teorema del lmite central


Si X es la media de una muestra aleatoria de tamao n extrada de una poblacin que 2 tiene media y varianza , entonces

Z=

X , n

es una variable aleatoria cuya funcin de probabilidad se aproxima a la de la distribucin normal estndar a medida que n aumenta

La demostracin formal de este teorema requiere el manejo de lmites de la funcin generadora X- . Tambin se puede experimentar mediante de momentos de la variable aleatoria Z = n simulaciones con el computador observndose que, sin importar la distribucin de probabilidad de una variable aleatoria discreta o continua X de la cual se muestea, el lmite de la variable aleatoria Z tiende a la forma tipo campana de la distribucin normal estndar, cuando n crece. Con carcter general, o al menos en los modelos de probabilidad clsicos, se admite como una aproximacin aceptable al modelo normal siempre que n 30 y se dice que la muestra es grande. Adicionalmente en este caso, si se desconoce la varianza de la poblacin se puede usar como aproximacin la varianza muestral: 2 S2

NOTA: El teorema del lmite central no implica que la distribucin de la variable X tiende a la distribucin normal a medida que n crece. El teorema establece que la distribucin de la variable Z tiende a la distribucin normal estndar cuando n crece. Ejemplo Un fabricante especifica que cada paquete de su producto tiene un peso promedio 22.5 gr. con una desviacin estndar de 2.5 gr. Calcule la probabilidad que una muestra aleatoria de 40 paquetes de este producto tenga un peso promedio no mayor a 20 gr.
Especificaciones para la poblacin X variable aleatoria continua (peso en gr. de cada paquete) parmetro de inters (media poblacional) 2 X tiene media = 22.5, y varianza = 2.52. No se especifica su distribucin Datos de la muestra Media muestral: X =

1 n Xi , tamao de la muestra n = 40, (muestra grande), n i=1

Por el teorema del lmite central, la variable aleatoria Z =

X n tiene distribucin de probabilidad aproximadamente normal estndar

176

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

La media de X es igual a la media poblacional

P = P( X 20) P( Z

20 20 22.5 ) = P( Z ) = P(Z 6.3246) = F(6.3246) 0 2.5 n 40

Conclusin Se observa que la probabilidad de que la media muestral tenga un valor menor o igual a 20 es aproximadamente cero, por lo tanto inferimos que lo especificado por el fabricante no es verdad.

Ejemplo Si X es una variable aleatoria exponencial con parmetro = 4 y de esta poblacin se toma una muestra aleatoria de tamao 36, determine la probabilidad de que la media aritmtica muestral tome valores entre 3.60 y 4.11
Si la variable X tiene distribucin exponencial, entonces su media y varianza son:

= E(X) = = 4,

2 = V(X) = 2 = 16 = 4

Si la muestra es grande, entonces por el teorema del lmite central

z=
Entonces

x tiene distribucin normal estndar aproximadamente / n


3.60 4 4 / 36 <Z< 4.11 4 4 / 36 ) = P(0.6 < Z < 0.165) = 0.2913

P(3.60 < X < 4.11) = P(

EJERCICIOS
1) Una mquina envasadora de refrescos est programada para que la cantidad de lquido sea una variable aleatoria con distribucin normal, con media 200 mililitros y una desviacin estndar de 10 mililitros. Calcule la probabilidad que una muestra aleatoria de 20 envases tenga una media menor que 185 mililitros 2) La altura media de los alumnos de un plantel secundario es 1.50 mts. con una desviacin estndar de 0.25 mts. Calcule la probabilidad que en una muestra aleatoria de 36 alumnos, la media sea superior a 1.60 mts.

177

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

9.3

LA DISTRIBUCIN T

La distribucin T o de Student es una funcin de probabilidad con forma tipo campana simtrica Su aplicacin ms importante se describe a continuacin Suponer que se toma una muestra aleatoria de tamao n<30 de una poblacin con distribucin normal con media y varianza desconocida. En este caso ya no se puede usar la variable aleatoria Z. En su lugar debe usarse otro estadstico denominado T o de Student Este estadstico es til cuando por consideraciones prcticas no se puede tomar una muestra aleatoria grande y se desconoce la varianza poblacional. Pero es necesario que la poblacin tenga distribucin normal. Definicin: Distribucin T Sean X y S2 la media y varianza de una muestra aleatoria de tamao n<30 tomada de una poblacin normal con media y varianza desconocida, entonces la variable aleatoria

T=

X , S n

tiene distribucin T con = n 1 grados de libertad

9.3.1 GRAFICO DE LA DISTRIBUCIN T


La forma especfica de la distribucin T depende del valor de , el cual es el parmetro para este modelo con la definicin: = n 1 y se denomina grados de libertad.

Distribucin T para = 2, 5, 20 grados de libertad. Para calcular probabilidad con la distribucin T, si no se dispone de una calculadora estadstica o un programa computacional estadstico, se pueden usar tablas que contienen algunos valores de esta distribucin para diferentes grados de libertad con la siguiente definicin:

178

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Definicin

es el valor de T tal que el rea a la derecha es igual a :

P(T t) =

Uso de la distribucin T

Ejemplo Una poblacin con distribucin aproximadamente normal tiene una media especificada de 5.5 siendo su varianza desconocida.
Calcule la probabilidad que una muestra aleatoria de tamao 6 tenga una media mayor o igual a 6.5 con una desviacin estndar de 0.5. Los datos especificados corresponden a la distribucin T x T= , con = n 1 = 5 grados de libertad S n 6.5 5.5 P( X 6.5) = P( T ) = P(T 4.9) 0.5 6 En la Tabla T, se puede observar en la fila = n1 = 5,

.40 .25 1 .325 1.000


2 3 4 5 6 7 .289 .277 .271 .267 .265 .263 .816 .765 .741 .727 .718 .711

.10 3.078 1.886 1.638 1.533 1.476 1.440 1.415

.05 .025 .01 .005 .0025 .001 .0005 6.314 12.706 31.821 63.657 127.320 318.310 636.620 2.920 4.303 6.965 9.925 14.089 23.326 31.598 2.353 3.182 4.541 5.841 7.453 10.213 12.924 2.132 2.776 3.747 4.604 5.598 7.173 8.610 2.015 2.571 3.365 4.032 4.773 5.893 6.869 1.943 2.447 3.143 3.707 4.317 5.208 5.959 1.895 2.365 2.998 3.499 4.029 4.785 5.408

t0.0025 = 4.773: t0.001 = 5.893:

P(T 4.773) = 0.0025 P(T 5.893) = 0.001

Aqu se ubica t = 4.9

Por lo tanto 0.001 P(T 4.9) 0.0025 Se puede concluir que 0.001 P( X 6.5) 0.0025

Mediante una interpolacin lineal se puede calcular una aproximacin mas precisa.

179

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

9.4

LA DISTRIBUCIN JI-CUADRADO

Esta distribucin se la obtiene de la distribucin gamma. Tiene forma tipo campana con sesgo positivo. Se puede demostrar que si X es una variable aleatoria con distribucin normal, entonces X2 es una variable aleatoria con distribucin ji-cuadrado. Este hecho explica la importancia de la distribucin ji-cuadrado en problemas de muestreo de poblaciones con distribucin normal. Una aplicacin importante es la estimacin de la varianza poblacional.

Definicin
Sean X y S2 la media y varianza de una muestra aleatoria de tamao n tomada 2 de una poblacin normal con media y varianza , entonces la variable aleatoria

2 = (n 1)

S2 , 2
2 2

tiene distribucin Ji-cuadrado con = n 1 grados de libertad El valor esperado de la variable es E( ) = n 1

9.4.1 GRFICO DE LA DISTRIBUCIN JI-CUADRADO


La forma especfica de esta distribucin de probabilidad depende del valor de , el cual es el parmetro para este modelo con la definicin = n1 y se denomina grados de libertad

La distribucin ji-cuadrado con = 2, 4, 6 Algunos valores de la distribucin ji-cuadrado estn tabulados para ciertos valores de y para valores tpicos de con la siguiente definicin

Definicin
2 2 es el valor de tal que el rea a la derecha es igual a :

P(2 2 ) =

180

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Uso de la distribucin ji-cuadrado

Ejemplo Una poblacin con distribucin aproximadamente normal tiene varianza especificada de 0.8. Calcule la probabilidad que una muestra aleatoria de tamao 6 tenga una varianza mayor o igual a 1.2.
Los datos especificados corresponden al uso de la distribucin ji-cuadrado: S2 2 = (n 1) 2 , con = n 1 grados de libertad 1.2 S2 2 2 2 2 P(S > 1.2) = P( > (n 1) 2 ) = P( > (6 1) ) = P( > 7.5) 0.8 En la Tabla_ji-cuadrado se puede observar en la fila = n 1 = 5


1 2 3 4 5 6 7

.995

.990

.975

.950

.900 .02 .21 .58 1.06 1.61 2.20 2.83

.500

.100

.050

.025

.010

.005

.00003 .0001 .01 .02 .07 .11 .21 .30 .41 .55 .68 .87 .99 .24

.0009 .0039 .05 .10 .22 .35 .48 .71 .83 1.15 .24 1.64 .69 2.17
2 2

.45 2.71 3.84 1.39 4.61 5.99 2.37 6.25 7.81 3.36 7.78 9.49 4.35 9.24 11.07 5.35 10.65 12.59 6.35 12.02 14.07

5.02 6.63 7.88 7.38 9.21 10.60 9.35 11.34 12.84 11.14 13.28 14.86 12.83 15.09 16.75 14.45 16.81 18.55 16.01 18.48 20.28

2 0.5 = 4.36: 2 0.1 =


Por lo tanto

P( 4.35) = 0.5 P( 9.24) = 0.1


2

Aqu se ubica

9.24:

2=7.5

0.1 P( 7.5) 0.5

Con lo cual se puede concluir que 0.1 P(S2 1.2) 0.5

Mediante una interpolacin lineal se puede calcular una aproximacin mas precisa.

181

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

9.5

DISTRIBUCIN F

Esta distribucin es til para realizar inferencias con las varianzas de dos poblaciones normales usando los datos de las varianzas de dos muestras aleatorias independientes con la siguiente definicin.

Definicin
2 Sean S1 y S2 2 las varianzas de dos muestras aleatorias independientes de tamao

2 2 n1 y n2 tomadas de poblaciones normales con varianzas 1 , 2 , entonces la

variable aleatoria

F=

2 2 S1 / 1 2 S2 2 / 2

tiene distribucin F con 1 = n1 1, 2 = n2 1 grados de libertad

9.5.1 GRFICO DE LA DISTRIBUCIN F


La distribucin F tiene forma tipo campana con sesgo positivo y depende de dos parmetros para este modelo: 1 , 2 los cuales se denominan grados de libertad

La distribucin F para varios 1 , 2 Algunos valores de esta distribucin estn tabulados para valores especficos de , 1, 2 de acuerdo a la siguiente definicin:

Definicin

F,1 ,2 es el valor de F tal que el rea a la derecha es igual a : P( F F,1 ,2 ) =

182

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Uso de la distribucin F La siguiente es una relacin til para obtener otros valores de la distribucin F:

F1 ,1 , 2 =

1 F , 2 ,1

Ejemplo Calcule F con = 0.05 y = 0.95 si 1 = 9, 2 = 7


Tabla F para = 0.05
.

1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 . 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.9 245.9 248.0 249.1 250.1 251.1 252.2 253.3 254.3 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.50 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.36 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23

8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71

F0.05, 9, 7 = 3.68

F0.95, 9, 7 =

1 F0.05, 7, 9

1 = 0.304 3.29

183

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

9.6

ESTADSTICAS DE ORDEN

Sea una poblacin infinita con densidad continua de la que se toma una muestra aleatoria de tamao n y se obtienen los valores x1, x2, x3, . . ., xn. Los datos se los escribe en orden creciente: x(1), x(2), x(3), . . ., x(n) Estos valores son instancias de las variables aleatorias X(1), X(2), X(3), . . ., X(n) Las variables definidas se denominan estadsticas de orden

Definicin: Estadsticas de orden para una muestra aleatoria de tamao n X(1), X(2), X(3), . . ., X(n)

9.6.1 DENSIDAD DE PROBABILIDAD DE LAS ESTADSTICAS DE ORDEN


Se puede probar que si f y F son respectivamente la densidad y la distribucin acumulada de X, entonces la densidad fr del estadstico de orden r es

Definicin: Densidad de probabilidad de la estadstica de orden r

fr (x (r) ) =

n! [F(x (r) )] (r 1)!(n r)!

r 1

[1 F(x (r) )]

n1

f(x (r) ), x (r)

Ejemplo. Se tiene una poblacin cuyos elementos estn definidos por una variable aleatoria contnua X con densidad de probabilidad: 0<x<1 kx, f(x) = 0, para otro x
De esta poblacin se toma una muestra aleatoria de tamao n = 5

Encuentre las estadsticas de orden 1, 2, 3, 4, 5 Solucin Primero determinamos el valor de k con la propiedad respectiva:
x2 k f(x)dx = kxdx = k = =1 0 0 2 0 2
1 1 1

k=2

0<x<1 2x, f(x) = 0, para otro x

Densidad de la variable poblacional: Su distribucin acumulada:

f(x) = 2x, 0 < x < 1

F(x) =

0 2xdx = x

- < x <

184

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Estadsticas de orden para la muestra aleatoria de tamao n = 5

Densidad del estadstico de orden r para n = 5, r = 1, 2, 3, 4, 5

fr (x (r) ) =

5! [F(x (r) )]r 1[1 F(x (r) )]5 r f(x (r) ), x (r) (r 1)!(5 r)!

Densidad del estadstico de orden uno

r = 1, n = 5, f(x) = 2x, 0 < x < 1, F(x) = x2, con la notacin: x = x(r)

f1(x) =

5! [x 2 ]11[1 x 2 )]5 1(2x), x (0,1) (1 1)!(5 1)!


0<x<1

Simpificando se obtiene f1(x) = 10(x)(1 x2 )4 ,

Sucesivamente se obtienen las densidades de los otros estadsticos de orden

r = 2, n = 5, f(x) = 2x, F(x) = x2, con la notacin: x = x(r) f2 (x) = 40x3 (1 x2 )3 , 0<x<1 r = 3, n = 5, f(x) = 2x, F(x) = x2, con la notacin: x = x(r) f3 (x) = 60x5 (1 x2 )2 , 0<x<1 r = 4, n = 5, f(x) = 2x, F(x) = x2, con la notacin: x = x(r) f4 (x) = 40x 7 (1 x 2 ), 0<x<1 r = 5, n = 5, f(x) = 2x, F(x) = x2, con la notacin: x = x(r) f5 (x) = 10x9 , 0<x<1

Determine la probabilidad que la estadstica de orden cuatro tome un valor menor que 1/2 P(X(4) < 1/2) =

1/ 2

40x 7 (1 x 2 )dx = 1/ 64

Graficar las densidades de las estadsticas de orden obtenidas


Grfico de f1 (x) , 0 < x < 1 Extremos f1(0) = 0, f1(1) = 0 Mximo:
' f1 (x) = 10(1 x2 )4 80x2 (1 x 2 )3 = 10(1 x 2 )3 [(1 x 2 ) 8x 2 ] = 0

(1 x2 )3 = 0

x = 1
1 3

(1 x 2 ) 8x 2 = 1 9x 2 = 0 x =

Mximo:

(1/3, 2.081)

185

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Grficos de las densidades de las estadsticas de orden

f5

f4 f2 f1 f3

EJERCICIOS
1) a) Encuentre t0.1 con =18. b) Encuentre t dado que P(t>t) = 0.05, =16 2) Una poblacin normal tiene especificada su media con el valor 5. Calcule la probabilidad que una muestra de 6 observaciones tenga una media menor que 4 con varianza de 1.2 3) Una poblacin con distribucin aproximadamente normal tiene varianza especificada de 1.4. Calcule la probabilidad que una muestra aleatoria de tamao 8 tenga una varianza menor que 0.8 4) Calcule F con = 0.05 y = 0.95 si 1 = 15, 2 = 20 5) Se tiene una poblacin cuya variable aleatoria X tiene la siguiente densidad de probabilidad: 2 1< x < 2 (x + 1), f(x) = 5 0, para otro x
Calcule la probabilidad que la estadstica de orden dos tome un valor mayor que 1.5

186

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Graficacin de la densidad de la distribucin T . El grfico est en la primera pgina >> t=-6:0.1:6; >> f1=tpdf(t, 2); >> f2=tpdf(t, 5); >> f3=tpdf(t, 20); >> plot(t,f1,'b'), grid on, hold on >> plot(t,f2,'k') >> plot(t,f3,'r') >> legend('nu=2','nu=5','nu=20')
Puntos para evaluar la distribucin T Puntos de la distribucin T

Graficacin

Rtulos

Grficacin de las estadsticas de orden. El grfico est en la pgina anterior >> f1='10*x*(1-x^2)^4'; >> f2='40*x^3*(1-x^2)^3'; >> f3='60*x^5*(1-x^2)^2'; >> f4='40*x^7*(1-x^2)'; >> f5='10*x^9'; >> ezplot(f1,[0,1]), grid on,hold on >> ezplot(f2,[0,1]) >> ezplot(f3,[0,1]) >> ezplot(f4,[0,1]) >> ezplot(f5,[0,1]) Calcule P(X(4) < 1/2) >> p = int(f4, 0, 1/2) p= 1/64
Definicin de las funciones de densidad

Graficacin

187

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10

ESTADSTICA INFERENCIAL

La Estadstica Inferencial proporciona las tcnicas para formular proposiciones acerca de la poblacin, incluyendo una medida para determinar el riesgo de la afirmacin.

10.1 INFERENCIA ESTADSTICA


Una inferencia estadstica es una afirmacin que se hace acerca de la poblacin en base a la informacin contenida en una muestra aleatoria tomada de esta poblacin. Debido a la naturaleza aleatoria de los datos obtenidos en la muestra, hay un riesgo en la certeza de la afirmacin propuesta, y es necesario cuantificar el valor de este riesgo. Un estimador es una variable aleatoria cuyas propiedades permiten estimar el valor del parmetro poblacional de inters. La muestra aleatoria proporciona nicamente un valor de esta variable y se denomina estimacin puntual. Para estimar al parmetro poblacional, es posible definir ms de un estimador, por ejemplo para  o la media muestral X . Cada a la media poblacional pueden elegirse la mediana muestral X uno tiene sus propias caractersticas, por lo tanto, es necesario establecer criterios para elegirlo. Sean : Parmetro poblacional de inters (Ej. ) : Estimador (Ej. X )  : Estimacin puntual de (Ej. x ) (Valor desconocido) (Variable aleatoria) (Un valor del estimador)

Distribucin muestral del estimador

El estimador es una variable aleatoria

Valor del estimador, o estimacin puntual, obtenido con la muestra

La intuicin sugiere que el estimador debe tener una distribucin muestral concentrada alrededor del parmetro y que la varianza del estimador debe ser la menor posible. De esta manera, el valor que se obtiene en la muestra ser cercano al valor del parmetro y ser til para estimarlo.

10.2 MTODOS DE INFERENCIA ESTADSTICA


Sean : Parmetro poblacional de inters (Ej. ) : Estimador (Ej. X )  : Estimacin puntual de (Ej. x ) (Valor desconocido) (Variable aleatoria) (Un valor del estimador)

10.2.1 ESTIMACIN PUNTUAL


parmetro que se desea estimar, con algn nivel de certeza especificado.

Se trata de determinar la distancia, o error mximo entre la estimacin puntual y el valor del

 | |

188

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.2.2 ESTIMACIN POR INTERVALO  Con el valor del estimador se construye un intervalo que contenga al valor del parmetro
que se desea estimar, con algn nivel de certeza especificado.

Li Ls
En donde Li y Ls son los lmites inferior y superior del intervalo

10.2.3 PRUEBA DE HIPTESIS


Se formula una hiptesis acerca del parmetro asignndole un valor supuesto 0 y con el valor  del estimador se realiza una prueba para aceptar o rechazar la hiptesis propuesta con algn nivel de certeza especificado. Hiptesis propuesta: = 0

10.3 PROPIEDADES DE LOS ESTIMADORES


Las siguientes definiciones establecen las caractersticas deseables de los estimadores Sean : Parmetro poblacional que se desea estimar. : Estimador

Definicin 1: Estimador insesgado Se dice que el estimador es un estimador insesgado del parmetro si E() =

Un estimador insesgado es aquel cuya media o valor esperado coincide con el parmetro que se quiere estimar.

En el grfico se observa que 1 es un estimador insesgado del parmetro pues E(1) = . En cambio, 2 no es un estimador insesgado del parmetro pues E(2 ) . Debido a lo anterior, es mas probable que una estimacin puntual de 1 est ms cercana al parmetro , que una estimacin puntual de 2

189

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. La media muestral X es un estimador insesgado del parmetro (media poblacional) Demostracin:
1 n 1 n 1 n 1 E( X ) = E xi = E [ xi ] = = n = n i= 1 n i=1 n i=1 n

Definicin 2: Estimador ms eficiente Se dice que un estimador 1 es ms eficiente que otro estimador 2 si ambos son insesgados y adems V(1) < V(2) Un estimador es ms eficiente si tiene menor varianza.

En el grfico se observa que 1 es un estimador ms eficiente del parmetro , que el estimador 2 pues ambos son insesgados pero la varianza de 1 es menor que la varianza de 2. Por lo tanto, es mas probable que una estimacin puntual de 1 est ms cercana al valor de , que una estimacin puntual de 2 Definicin 3: Estimador consistente Se dice que un estimador es un estimador consistente del parmetro si es un estimador insesgado de y lim V() = 0
n

Ejemplo. La media muestral X es un estimador consistente de Demostracin: V( X ) =

2 2 =0 X lim n n n

Definicin 4: Sesgo de un estimador El sesgo B de un estimador est dado por B = E() Es la diferencia entre el valor esperado del estadstico y el valor del parmetro. De acuerdo con la definicin anterior, el sesgo de un estimador insesgado es cero pues E(1) = .

190

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Definicin 5: Error cuadrtico medio (ECM) Es el valor esperado del cuadrado de la diferencia entre el estimador y el parmetro : ECM() = E[ ]2 Si se desarrolla el cuadrado y se sustituye la definicin de varianza y de sesgo se obtiene: ECM() = V() + [E() ]2 = V() + B2

Esta definicin resume las caractersticas deseables de un estimador: su varianza debe ser mnima y su distribucin de muestreo debe estar concentrada alrededor del parmetro que es estimado, es decir el sesgo debe ser mnimo.

Ejemplo Pruebe que la varianza muestral es un estimador insesgado de la varianza poblacional si se 2 toma una muestra de tamao n de una poblacin normal con media y varianza Sea S2 =

1 n (xi x)2 . Se tiene que probar que E(S2) = 2 n 1 i=1

Primero expresamos la varianza muestral en una forma conveniente n n 2 2 1 n 1 n 2 1 n 2 S2 = (xi x)2 = (xi 2xi x + x ) = ( xi 2x xi + x ) n 1 i =1 n 1 i=1 n 1 i=1 i=1 i=1

2 2 2 2 1 n 2 1 n 2 1 n 2 ( xi 2x(nx) + nx ) = ( xi 2nx + nx ) = ( xi nx ) n 1 i =1 n 1 i =1 n 1 i =1

Con la definicin de valor esperado 2 2 1 n 2 1 n E(S2 ) = E[ ( Xi nX )] = [ E(Xi2 ) nE(X )] n 1 i =1 n 1 i =1 Cada variable Xi proviene de la misma poblacin con varianza 2 y media 2 2 2 2 2 2 E(Xi2 ) = 2 + 2 x i = = E(X i ) E (X i ) = E(X i ) La media muestral es una variable aleatoria con media y varianza 2/n 2 2 2 2 2 2 2 2 = = E(X ) E (X) = E(X ) E(X ) = + 2 x n n Se sustituyen en la definicin anterior con lo cual se completa la demostracin n 1 2 1 E(S2 ) = ( ( 2 + 2 ) n( + 2 )) = (n 2 + n 2 n ) n 1 i=1 n n1
= 2 (n 1) = 2 n1

191

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo Se tiene una poblacin de tamao N = 6 definida por: {1, 2, 3, 3, 4, 5}


a) Calcule la media de la poblacin 2 b) Calcule la varianza de la poblacin c) Especifique cuales son todas las muestras de tamao n = 3 que se pueden obtener d) Determine la distribucin de la media muestral e) Determine la distribucin de la mediana muestral f) Verifique que la media muestral es un estimador insesgado g) Verifique si la mediana muestral es un estimador insesgado h) Verifique que la media muestral es un estimador mas eficiente que la mediana muestral

Solucin a) Calcule la media de la poblacin De la poblacin especificada se deduce que la distribucin de probabilidad es:
1/ 6, x = 1, 2, 4, 5 f(x) = P(X = x) = 2 / 6, x=3 0, otro x

xf(x) = 1(1/6) + 2(1/6) + 3(2/6) + 4(1/6) + 5(1/6) = 3


x

b) Calcule la varianza de la poblacin 2 = E(X2) E2(X) E(X2) = x 2 f(x) = 12 (1/6) + 22 (1/6) + 32 (2/6) + 42 (1/6) + 52 (1/6) = 32/3
2
x

= 32/3 32 = 5/3
2

c) Especifique cuales son todas las muestras de tamao n = 3 que se pueden obtener Cantidad de muestras de tamao 3 N 6 6! (Las muestras son combinaciones) = 20 = = n 3 3! 3! Muestras (1, 2, 3) (1, 2, 4) (1, 2, 5) (1, 3, 3) (1, 3, 4) (1, 3, 5) (1, 4, 5) (2, 3, 3) (2, 3, 4) (2, 3, 5) (2, 4, 5) (3, 3, 4) (3, 3, 5) (3, 4, 5) Total Cantidad 2 (1) 1 1 1 2 2 1 1 2 2 1 1 1 2 20 Media muestral x 6/3 7/3 8/3 7/3 8/3 9/3 10/3 8/3 9/3 10/3 11/3 10/3 11/3 12/3 Mediana muestral  x 2 2 2 3 3 3 4 3 3 3 4 3 3 4

192

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

(1) La cantidad de formas diferentes de tomar un elemento 1, existiendo solamente uno en la poblacin, un elemento 2, existiendo solamente uno en la poblacin, y un elemento 3, del cual existen dos en la poblacin es: 1 1 2 = 2 , etc 1 1 1 Las muestras son combinaciones, por lo tanto el orden de los elementos no es de inters. d) Determine la distribucin de probabilidad de la media muestral X Media muestral x 6/3 7/3 8/3 9/3 10/3 11/3 12/3 Total f( x ) = P(X = x) 2/20 2/20 4/20 4/20 4/20 2/20 2/20 1

i e) Determine la distribucin de probabilidad de la mediana muestral X


Mediana muestral  x 2 3 4 Total

 ) = P(X i = x)  f( x
4/20 12/20 4/20 1

f) Verifique que la media muestral es un estimador insesgado de


X = E(X) =

x f(x) = (6/3)(2/20) + (7/3)(2/20) + . . . + (12/3)(2/20) = 3


x

E(X) = 3 =

X es un estimador insesgado de

g) Verifique si la mediana muestral es un estimador insesgado de

i X i = E(X) =

 f(x)  = 2(4/20) + 3(12/20) + 4(4/20) = 3 x 


x

i =3= E(X)

i es un estimador insesgado de X

Nota: La media muestral es un estimador insesgado de , pero la mediana lo es nicamente cuando la distribucin de probabilidad de la variable X es simtrica:

193

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Diagrama de barras de la variable aleatoria X h) Verifique que la media muestral es un estimador ms eficiente que la mediana muestral Se deben comparar las varianzas de los estimadores X y
2 = V(X) = E(X ) E 2 (X) X
E(X ) =
2

i X

x
x

f(x) =(6/3) (2/20) + (7/3) (2/20) + . . . + (12/3) (2/20) = 9.333

V(X) = 9.333 32 = 0.333

2 i i i2 2 i = V(X) = E(X ) E (X) X

i2) = E(X

 x 
x

 = 22 (4/20) + 32 (12/20) + 42 (4/20) = 47/5 f(x)

i = 47/5 32 = 0.4 V(X)

i La media muestral X es un estimador ms eficiente que la mediana V(X ) < V(X) i para estimar a la media poblacional muestral X

EJERCICIOS
1) Suponga que se tiene una poblacin cuyos elementos son: { 3, 4, 4, 6} de la cual se toman muestras de tamao 2. a) Escriba el conjunto de todas las muestras de tamao 2 que se pueden obtener con los elementos de la poblacin dada. b) Grafique el histograma de frecuencias de la media muestral c) Determine la distribucin de probabilidad de la media muestral d) Demuestre que la media muestral es un estimador insesgado de la media poblacional.

194

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2) Si se toma una muestra de tamao n = 3 de una poblacin cuya distribucin de probabilidades est dada por 1 x = 1,2,3, 4 x, f(x) = 10 otro x 0, Determine si la mediana muestral es un estimador ms eficiente de la media poblacional que la media muestral Sugerencia: Asocie la distribucin de probabilidad de la variable aleatoria X a la siguiente poblacin: { 1, 2, 2, 3, 3, 3, 4, 4, 4, 4 } y liste todas las muestras de tamao 3

MATLAB
Estudio de estimadores de la media poblacional >> x=[1 2 3 3 4 5]; >> format rat >> mu = mean(x) mu = 3 >> sigma2 = var(x, 1) sigma2 = 5/3 >> muestras=combnk(x,3) muestras = 3 4 5 3 4 5 3 3 5 3 3 4 2 4 5 2 3 5 2 3 4 2 3 5 2 3 4 2 3 3 1 4 5 1 3 5 1 3 4 1 3 5 1 3 4 1 3 3 1 2 5 1 2 4 1 2 3 1 2 3 >> n=length(muestras) n= 20 >> medias = mean(muestras' ) medias = 4 4 11/3 10/3 10/3 3 8/3 3 Poblacin Formato para ver nmeros racionales Media poblacional

Varianza poblacional. (Se escribe var(x) para varianza de una muestra) Lista de las muestras de tamao 3

Cantidad de muestras de tamao 3

Lista de las medias de las 20 muestras 11/3 8/3 10/3 7/3 3 8/3 10/3 7/3 3 2 8/3 2

195

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

>> medianas = median(muestras' ) medianas = 4 4 3 3 4 3 3 3 >> mmedias = mean(medias) mmedias = 3 >> mmedianas=mean(medianas) mmedianas = 3 >> vmedias =var(medias', 1) vmedias = 1/3 >> vmedianas=var(medianas', 1) vmedianas = 2/5

Lista de las medianas de las 20 muestras 4 3 3 3 3 2 3 2 3 2 3 2

Media de las medias muestrales (estimador insesgado) Media de las medianas muestrales Coincide con la media poblacional varianza de la media muestral

Varianza de la mediana muestral

La varianza de la mediana muestral es mayor a la varianza de la media muestral, por lo tanto, la media muestral es un estimador ms eficiente de la media poblacional

196

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.4 INFERENCIAS RELACIONADAS CON LA MEDIA


10.4.1 ESTIMACIN PUNTUAL DE LA MEDIA Caso: Muestras grandes (n 30) Parmetro: (Es la medida poblacional cuyo valor se desea estimar) 2 Poblacin con distribucin desconocida, varianza Estimador: X (Media muestral, se usa para estimar al parmetro) 1 n 2 = X = Xi , Media: X = Varianza: 2 X n n i= 1
Siendo la muestra grande, por el teorema del lmite central, el estadstico X Z= , es una variable con distribucin normal estndar aproximadamente / n Definicin:

z
es el valor de la variable Z en la distribucin normal estndar tal que el rea

a la derecha debajo de f(z) es igual a un valor especificado : P(Z z) = . f(z)

Ejemplo Encuentre z0.01 P(Z z0.01) = 0.01 P(Z z0.01) = 0.99 F(z0.01) = 0.99 z0.01 = 2.33 (Con la tabla de la distribucin normal estndar)

ALGUNOS VALORES DE USO FRECUENTE QUE CONVIENE RECORDAR

z0.1 z0.05 z0.025 z0.01 z0.005

= = = = =

1.28 1.645 1.96 2.33 2.575

197

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

FRMULA PARA ESTIMACIN PUNTUAL DE LA MEDIA


Consideremos la distribucin normal estndar separando el rea en tres partes. La porcin central con rea o probabilidad 1 - , y dos porciones simtricas a los lados con rea o probabilidad /2 cada una, siendo un valor especificado

Por la definicin de probabilidad, se puede escribir: P(-z/2 Z z/2) = 1 - Es equivalente a decir que la desigualdad - z/2 Z z/2 se satisface con probabilidad 1 - O equivalentemente:

| Z | z/2

se satisface con probabilidad 1 -

Como se supone que la muestra es grande, por el teorema del lmite central X Z= , tiene distribucin normal estndar aproximadamente / n Sustituyendo en la desigualdad se obtiene: X | | z/2 con probabilidad 1 - / n De donde | X - | z/2 con probabilidad 1 - . n | X - | es el error en la estimacin del parmetro mediante X Definicin: Estimacin puntual de la media, n 30

E = z/2

es el mximo error en la estimacin con probabilidad 1 - n

Es decir que si se estima mediante X con una muestra de tamao n30, entonces se puede afirmar con una confianza de 1 - que el mximo error no exceder de z/2
2

NOTA: Si se desconoce la varianza poblacional se puede usar como aproximacin la 2 varianza muestral S , siempre que n 30 Ejemplo Se ha tomado una muestra aleatoria de 50 artculos producidos por una industria y se obtuvo que el peso de la media muestral fue 165 gr. con una desviacin estndar de 40 gr. Encuentre el mayor error en la estimacin de la media poblacional, con una confianza de 95%.

198

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Parmetro: Estimador: X n30: muestra grande 1 - = 0.95 /2 = 0.025 Z0.025 = 1.96 2 S2 S = 40 E = z/2

40 = 1.96 ( ) = 11.08 gr. 50 n

Conclusin Se puede afirmar con una confianza de 95% que al usar la media muestral para estimar a la media poblacional el error no exceder en mas de 11.08 gr. .

10.4.2 TAMAO DE LA MUESTRA


La frmula anterior tambin se puede usar para estimar el tamao de la muestra para que el error en la estimacin no exceda a cierto valor con una probabilidad especificada Definicin: Tamao de la muestra, n 30 Tamao de la muestra para que con probabilidad 1 - el mximo error en la estimacin no exceda al valor especificado E

n = Z / 2 E

Se obtiene directamente de la frmula anterior:

Ejemplo Se conoce que la varianza de una poblacin es 20. Determine cual debe ser el tamao de la muestra para que el error mximo en la estimacin de la media poblacional mediante la media muestral no exceda de 1 con una probabilidad de 99% Solucin 1 - = 0.99 Z/2 = Z0.005 = 2.575 = 20 = 4.4721 E=1 4.4721 n = Z / 2 = 2.575 = 132.6 n 133 1 E Conclusin Debe usarse una muestra de tamao 133
2 2

EJERCICIOS
1) Calcule Z0.025 2) La media de la presin sangunea de 40 mujeres de edad avanzada es 140. Si estos datos se pueden considerar como una muestra aleatoria de una poblacin cuya desviacin estndar es 10, encuentre, con una confianza de 95%, el mayor error en la estimacin de la media poblacional.

199

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.4.3 ESTIMACIN POR INTERVALO Caso: Muestras grandes (n 30) Parmetro: (Es la medida poblacional cuyo valor se desea estimar) 2 Poblacin con distribucin desconocida, varianza Estimador: X (Media muestral, se usa para estimar al parmetro) 1 n 2 2 X = Xi , Media: X = Varianza: X = n n i= 1
Siendo la muestra grande, por el teorema del lmite central, el estadstico X Z= , es una variable con distribucin normal estndar aproximadamente / n

FRMULA PARA ESTIMACIN POR INTERVALO PARA LA MEDIA


Consideremos la distribucin normal estndar separando el rea en tres partes. La porcin central con rea o probabilidad 1 - , y dos porciones simtricas a los lados con rea o probabilidad /2 cada una, siendo un valor especificado

Por la definicin de probabilidad, se puede escribir: P(-z/2 Z z/2) = 1 - Es equivalente a decir que la desigualdad - z/2 Z z/2 se satisface con probabilidad 1 - O equivalentemente:

| Z | z/2

se satisface con probabilidad 1 -

Como se supone que la muestra es grande, por el teorema del lmite central X Z= , tiene distribucin normal estndar aproximadamente / n Sustituyendo se obtiene: X - z/2 z/2 con probabilidad 1 - / n De donde al despejar el parmetro de inters se tiene, X - z/2 X + z/2 , con probabilidad 1 - n n Definicin: Estimacin por intervalo para la media Intervalo de confianza para con nivel 1 - , con una muestra de tamao n 30, X - z/2 X + z/2 n n Los valores extremos se denominan lmites de confianza

200

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo Se ha tomado una muestra aleatoria de 50 artculos producidos por una industria y se obtuvo que la media muestral del peso de los artculos fue 165 gr. con una desviacin estndar de 40 gr. Encuentre un intervalo para la media poblacional, con un nivel de confianza de 98%. Parmetro: Estimador: X n 30: muestra grande 1 - = 0.98 /2 = 0.01 Z0.01 = 2.33 2 S2 S = 40 X - z/2 X + z/2 n n Sustituimos los datos 40 40 165 - 2.33 165 + 2.33 50 50 151.8 178.1 Conclusin Se puede afirmar con una confianza de 98% que la media poblacional se encuentra entre 151.8 y 178.1 gr.

10.4.4 INTERVALOS DE CONFIANZA UNILATERALES Caso: Muestras grandes (n 30) Parmetro: (Es la medida poblacional cuyo valor se desea estimar) 2 Poblacin con distribucin desconocida, varianza Estimador: X (Media muestral, se usa para estimar al parmetro) FRMULA PARA ESTIMACIN POR INTERVALOS UNILATERALES
Con referencia a la distribucin normal estndar:

En forma similar al caso considerado para el intervalo de confianza bilateral, se pueden obtener frmulas para intervalos de confianza unilaterales que contengan a la media con una probabilidad especificada Definicin: Estimacin por intervalo para la media Intervalo de confianza para con nivel 1 - , con una muestra de tamao n 30, X + z Intervalo de confianza unilateral inferior n X - z Intervalo de confianza unilateral superior n

201

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) De una poblacin con distribucin desconocida se tom una muestra aleatoria de tamao 40 y se obtuvo una media de 65.2 y una desviacin estndar de 16. Construya un intervalo de confianza de 90% para la media poblacional. 2) Un fabricante de pinturas desea determinar el tiempo promedio de secado de una nueva pintura. En 36 pruebas realizadas obtuvo un tiempo de secado medio de 64.2 minutos con una desviacin estndar de 8.5 minutos. Construya un intervalo de confianza unilateral inferior de 95% para la media del tiempo de secado de la nueva pintura.

MATLAB
Obtencin de intervalos de confianza para la media, n 30 Se pueden calcular intervalos de confianza usando la funcin inversa de la distribucin normal >> p = [0.01, 0.99]; >> x = norminv(p, 165, 40/sqrt(50)) x= 151.8402 178.1598 >> p = [0, 0.98]; >> x = norminv(p, 165, 40/sqrt(50)) x= -Inf 176.6178 >> p = [0.02, 1]; >> x = norminv(p, 165, 40/sqrt(50)) x= 153.3822 Inf Intervalo de confianza bilateral 1 - = 98%, X = 165, S = 40, n = 50

Intervalo de confianza unilateral inferior 1 - = 98%, X = 165, S = 40, n = 50

Intervalo de confianza unilateral superior 1 - = 98%, X = 165, S = 40, n = 50

202

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.4.5 ESTIMACIN PUNTUAL DE LA MEDIA Caso: Muestras pequeas (n<30)


Parmetro: (Es la medida poblacional cuyo valor se desea estimar) 2 Poblacin con distribucin normal, varianza desconocida Estimador: X (Media muestral, se usa para estimar al parmetro) Para realizar inferencias se usa una variable aleatoria con distribucin T X , con = n 1 grados de libertad T= s/ n

FRMULA PARA ESTIMACIN PUNTUAL DE LA MEDIA


Consideremos la distribucin T separando el rea en tres partes. La porcin central con rea o probabilidad 1 - , y dos porciones simtricas a los lados con rea o probabilidad /2 cada una, siendo un valor especificado

Por la definicin de probabilidad, se puede escribir: P(-t/2 T t/2) = 1 - Es equivalente a decir que la desigualdad - t/2 T t/2 se satisface con probabilidad 1 - O equivalentemente:

| T | t/2

se satisface con probabilidad 1 -

Como se supone que la muestra es grande, por el teorema del lmite central X T= , tiene distribucin normal estndar aproximadamente s/ n Sustituyendo en la desigualdad se obtiene: X | | t/2 con probabilidad 1 - s/ n De donde | X - | t/2 con probabilidad 1 - . n | X - | es el error en la estimacin del parmetro mediante X

Definicin: Estimacin puntual de la media, n < 30

E = z/2

s es el mximo error en la estimacin con probabilidad 1 - n

203

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Es decir que si se estima mediante X con una muestra de tamao n < 30, entonces se puede afirmar con una confianza de 1 - que el mximo error no exceder a z/2

s n

Ejemplo Se ha tomado una muestra aleatoria de 20 artculos producidos por una industria y se obtuvo que el peso de la media muestral fue 165 gr. con una desviacin estndar de 40 gr. Encuentre el mayor error en la estimacin de la media poblacional, con una confianza de 95%. Suponga que la poblacin tiene distribucin normal. Solucin Parmetro: , poblacin normal, varianza desconocida Estimador: X n <30: muestra pequea 1 = 0.95 /2 = 0.025 t0.025 = 2.093, con la tabla T =20 1=19 grados de libertad E = t/2

s 40 = 2.093( ) = 18.72 gr. 20 n

Conclusin Se puede afirmar con una confianza de 95% que al usar la media muestral para estimar a la media poblacional, el error no exceder a 18.72 gr.

EJERCICIOS
Un inspector de alimentos examina una muestra aleatoria de 10 artculos producidos por una fbrica y obtuvo los siguientes porcentajes de impurezas: 2.3, 1.9, 2.1, 2.8, 2.3, 3.6, 1.8, 3.2, 2.0, 2.1. Suponiendo que la poblacin tiene distribucin normal, encuentre el mayor error en la estimacin de la media poblacional, con una confianza de 95%.

204

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.4.6 ESTIMACIN POR INTERVALO Caso n < 30 (Muestras pequeas)


Parmetro: (Es la medida poblacional cuyo valor se desea estimar) 2 Poblacin con distribucin normal, varianza desconocida Estimador: X (Media muestral, se usa para estimar al parmetro) Para realizar inferencias se usa una variable aleatoria con distribucin T X , con = n-1 grados de libertad T= s/ n NOTA: Si la poblacin tuviese distribucin normal y la varianza poblacional fuese conocida, la variable aleatoria para realizar inferencias tendra distribucin normal estndar Z, sin importar el tamao de la muestra.
2

FRMULA PARA ESTIMACIN POR INTERVALO PARA LA MEDIA


Consideremos la distribucin T separando el rea en tres partes. La porcin central con rea o probabilidad 1 - , y dos porciones simtricas a los lados con rea o probabilidad /2 cada una, siendo un valor especificado

Por la definicin de probabilidad, se puede escribir: P(-t/2 T t/2) = 1 - Es equivalente a decir que la desigualdad - t/2 T t/2 se satisface con probabilidad 1 - Sustituyendo: T= Se obtiene: t/2
X t/2 s n X en la desigualdad s n

con probabilidad 1 -

De donde al despejar el parmetro de inters se tiene, s s X t/2 X + t/2 , con probabilidad 1 - n n Definicin Intervalo de confianza para con nivel 1 - , con n < 30, poblacin normal y varianza desconocida,

X - t/2

s s X + t/2 n n

Los valores extremos son los lmites de confianza

205

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo De una poblacin con distribucin normal se tom una muestra aleatoria de 4 observaciones obtenindose: 9.4, 12.2, 10.7, 11.6. Encuentre un intervalo para la media poblacional, con un nivel de confianza de 90% Parmetro: , poblacin normal, varianza desconocida Estimador: X n<30: muestra pequea Calculamos la media y varianza muestrales: 1 n 1 4 1 X = xi = xi = (9.4 + 12.2 + 10.7 + 11.6) = 10.975 n i=1 4 i =1 4

S2=

1 n 1 (xi x)2 = 3 [(9.4 10.975)2 + ... ] = 1.4825 n 1 i =1

S= S2 = 1.4825 = 1.2176 1 = 0.90 /2 = 0.05 t/2 = t0.05 = 2.353, (tabla T) = 4 1 = 3 grados de libertad Sustitumos los valores en la desigualdad s s X t/2 X + t/2 n n Se obtiene 1.2176 1.2176 10.475 2.353 10.475 + 2.353 4 4 9.5425 12.4075 Conclusin Se puede afirmar con una confianza de 90% que la media poblacional se encuentra entre 9.5425 y 12.4075

EJERCICIOS
1) De una poblacin con distribucin normal y varianza 225 se tom una muestra aleatoria de tamao 20 y se obtuvo una media de 64.5. Construya un intervalo de confianza de 95% para la media poblacional. 2) Un fabricante de pinturas desea determinar el tiempo promedio de secado de una nueva pintura. En diez pruebas realizadas obtuvo un tiempo de secado medio de 65.2 minutos con una desviacin estndar de 9.4 minutos. Construya un intervalo de confianza de 95% para la media del tiempo de secado de la nueva pintura. Suponga que la poblacin es normal. 3) El peso de seis artculos de una muestra aleatoria tomada de la produccin de una fbrica fueron: 0.51, 0.59, 0.52, 0.47, 0.53, 0.49 kg. Encuentre un intervalo de confianza de 98% para la media del peso de todos los artculos producidos. Suponga distribucin normal.

206

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Obtencin de intervalos de confianza para la media, n < 30
Vector conteniendo una muestra de cuatro datos >> u = [9.4 12.2 10.7 11.6]; >> m = mean(u) Media muestral m= 10.9750 >> s = std(u) Desviacin estndar muestral s= 1.2176 >> ta = tinv(0.95,3) Valor del estadstico t para = 0.05, = 3 ta = 2.3534 >> x =[m - ta*s/sqrt(4), m+ta*s/sqrt(4)] Intervalo de confianza bilateral para x= 9.5423 12.4077

207

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.5 PRUEBA DE HIPTESIS


Esta tcnica estadstica es muy utilizada como soporte a la investigacin sistemtica y cientfica. Consiste en suponer algn valor para el parmetro de inters y usar los datos de la muestra para aceptar o rechazar esta afirmacin. Es importante entender las diferentes situaciones que pueden ocurrir al probar una hiptesis estadsticamente. Sea Ho: hiptesis que se propone para el parmetro de inters Suponer que se dispone de datos con los que se realiza una prueba estadstica de esta hiptesis. Entonces pueden ocurrir las siguientes situaciones para tomar una decisin: Decisin

Si con el resultado de la prueba estadstica rechazamos la hiptesis propuesta sin conocer que era verdadera, entonces cometemos el Error tipo I Si con el resultado de la prueba estadstica aceptamos la hiptesis propuesta sin conocer que era falsa, entonces cometemos el Error tipo II Ambos errores pueden tener consecuencias importantes al tomar una decisin en una situacin real. Por lo tanto es necesario cuantificar la probabilidad de cometer cada tipo de error. Definiciones Medida del error tipo I:

= P(Rechazar Ho dado que Ho es verdadera)


Medida del error tipo II:

= P(Aceptar Ho dado que otra hiptesis es verdadera)


El valor se denomina nivel de significancia de la prueba y puede darse como un dato para realizar la prueba. Algunos valores tpicos para son 10%, 5%, 2%, 1%

Terminologa Ho: Hiptesis nula. Ha: Hiptesis alterna. Es la hiptesis que se plantea o propone para el parmetro en estudio. Es la hiptesis que se plantea en oposicin a Ho y que es aceptada en caso de que Ho sea rechazada

Generalmente es de inters probar Ha, por lo que se plantea Ho con la esperanza de que sea rechazada utilizando la informacin de la muestra.

208

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo Suponer que se desea probar, con algn nivel de significancia que la media poblacional no es igual a 5 Entonces se puede plantear: Ho: = 5 Ha: 5 Si con los datos de la muestra se puede rechazar Ho, entonces habremos probado Ha

TIPOS DE PRUEBAS
Sea : parmetro de inters para la prueba 0: algn valor supuesto para el parmetro

Pruebas de una cola 1) Ho: = 0: Ha: < 0: 2) Ho: = 0: Ha: > 0:

(hiptesis nula) (hiptesis alterna) (hiptesis nula) (hiptesis alterna)

Prueba de dos colas (hiptesis nula) 3) Ho: = 0: Ha: < 0 > 0: (hiptesis alterna)

PROCEDIMIENTO BSICO PARA REALIZAR UNA PRUEBA DE HIPTESIS


Para establecer el procedimiento usamos un caso particular, pero la tcnica es aplicable para realizar pruebas con otros parmetros. Este procedimiento bsico consta de seis pasos.

10.5.1 PRUEBA DE HIPTESIS RELACIONADA CON LA MEDIA Caso n 30 (Muestras grandes)


Parmetro: (media poblacional) 2 Poblacin con distribucin desconocida, varianza X (media muestral) Estimador: Valor propuesto para el parmetro: 0 PASOS Paso 1. Formular la hiptesis nula: Ho: = 0

Paso 2. Formular una hiptesis alterna que es de inters probar. Elegir una entre: Ha: > 0 Ha: < 0 Ha: < 0 > 0 Paso 3. Especificar el nivel de significancia de la prueba Paso 4. Seleccionar el estadstico de prueba y definir la regin de rechazo de Ho Por el Teorema del Lmite Central, el estadstico X o , tiene distribucin normal estndar aproximadamente Z= / n La regin de rechazo depende de la hiptesis alterna elegida Ha y est determinada por el valor de especificado. Se analizan los tres casos

209

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Primer caso

Ho: = 0 Ha: > 0

Con el valor especificado se obtiene el valor de Z el cual delimita la regin de rechazo. La media muestral X es un estimador insesgado del parmetro , por lo tanto su valor esperado coincide con el valor propuesto 0 para el parmetro. Segn lo anterior, el valor obtenido para la media muestral X debera estar cerca de 0, y por X o estar cercano a 0, a la izquierda de Z. lo tanto, el valor de Z = / n Pero si el valor obtenido en la media muestral X es significativamente mas grande que 0, entonces Z caer en la regin de rechazo definida: Z > Z. Esto debe entenderse como una evidencia de que la media 0 propuesta para el parmetro no es verdad y que debera ser algn valor ms grande, es decir: > 0 Con esta interpretacin rechazamos Ho en favor de Ha con un nivel de significancia Sin embargo, siendo X una variable aleatoria, es posible que caiga en la regin de rechazo an siendo verdad que 0 es el verdadero valor de la media muestral . Esto constituye el error tipo I, y la probabilidad que esto ocurra es tambin

Esta interpretacin debe ayudar a entender los otros dos casos: Segundo caso Ho: = 0 Ha: < 0

210

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Tercer caso

Ho: = 0 Ha: < 0 > 0

Paso 5. Calcular el valor del estadstico de prueba con los datos de la muestra Paso 6. Tomar una decisin Si el valor del estadstico de prueba cae en la regin de rechazo, la decisin es rechazar Ho en favor de Ha. Pero, si el valor no cae en esta regin crtica, se dice que no hay evidencia suficiente para rechazar Ho. En este caso es preferible abstenerse de aceptar como verdadera Ho pues esto puede introducir el Error tipo II

Ejemplo Una muestra aleatoria de 100 paquetes mostr un peso promedio de 71.8 gr. con una desviacin estndar de 8.9 gr. Pruebe, con un nivel de significancia de 5%, que el peso promedio de todos los paquetes (poblacin) es mayor a 70 gr. Seguimos los pasos indicados en el procedimiento bsico indicado: 1. Hiptesis nula = 70 Ho: Hiptesis alterna > 70 Ha: Nivel de significancia

2.

3.

= 0.05
4. Estadstico de prueba X o 2 2 por el Teorema del Lmite Central. Adems s Z= / n Regin de rechazo z = z0.05 = 1.645 Rechazar Ho en favor de Ha, si z > 1.645 5. Valor del estadstico X o 71.8 70 = = 2.02 2.02 cae en la regin de rechazo Z= / n 8.9 / 100 Decisin Se rechaza que la media poblacional es 70 y se concluye, con una significancia de 5% que el peso promedio de la poblacin es mayor a 70 gr,

6.

211

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) Una muestra aleatoria de n=40 observaciones tomada de una poblacin en estudio, produjo una media X =2.4 y una desviacin estndar S=0.28. Suponga que se desea demostrar que la media poblacional es mayor a 2.3 a) Enuncie la hiptesis nula para la prueba b) Enuncie la hiptesis alterna para la prueba c) Use su intuicin para predecir si el valor de la media muestral X = 2.4 es suficiente evidencia para afirmar que la media poblacional es mayor que el valor propuesto 2.3 d) Realice la prueba de hiptesis con un nivel de significancia de =0.05 y determine si los datos son evidencia suficiente para rechazar la hiptesis nula en favor de la hiptesis alterna. 2) Repita el ejercicio 1) con los mismos datos, pero suponiendo que se desea demostrar que la media poblacional es menor que 2.7 3) Repita el ejercicio 1) con los mismos datos, pero suponiendo que se desea demostrar que la media poblacional es diferente que 2.7

MATLAB
Prueba de hiptesis relacionada con la media, n 30 Vector con los datos de una muestra >> x = [71.76 82.60 71.79 68.23 69.34 69.36 69.58 73.35 83.16 70.62 75.33 70.77 88.38 67.15 72.72 64.61 77.86 50.76 80.61 73.75 74.13 ... 60.49 56.99 65.54 74.30 66.98 59.93 81.35 65.46 71.70 ... 69.45 56.99 62.64 73.96 60.62 68.71 63.42 61.35 62.71 ... 81.27]; media muestral

>> m=mean(x) m= 69.7430 >> s=std(x) s= 8.0490

desviacin estndar muestral

>> [h,p,ci,z]=ztest(x, 67, 8.049, 0.05, 1) Prueba unilateral derecha h=1 p = 0.0156 ci = 67.6497 z = 2.1553

Prueba Ho: = 67 vs. Ha: > 67, S = 8.049, = 0.05. Prueba unilateral derecha

Inf

h=1 La evidencia es suficiente para rechazar Ho Valor p de la prueba Intervalo de confianza con nivel 1 Valor del estadstico de prueba Z

212

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.5.2 PRUEBA DE HIPTESIS RELACIONADA CON LA MEDIA Caso n<30 (Muestras pequeas) Parmetro: (Es la medida poblacional cuyo valor se desea estimar) 2 Poblacin con distribucin normal, varianza desconocida Estimador T (Variable aleatoria con distribucin T, con = n-1 ) Valor propuesto para el parmetro: 0
Para realizar inferencias se usa una variable aleatoria con distribucin T X , con = n 1 grados de libertad T= s/ n

PROCEDIMIENTO BSICO
PASOS 1. Formular la hiptesis nula: Ho: = 0

2. Formular una hiptesis alterna, elegir una entre: Ha: < 0 Ha: > 0 Ha: 0 3. Especificar el nivel de significancia de la prueba 4. Seleccionar el estadstico de prueba y definir la regin de rechazo de Ho X o , tiene distribucin t con = n1 grados de libertad t= s/ n Ha Regin de rechazo de Ho en favor de Ha

< 0 > 0 < 0

t < -t t > t t <-t/2 t > t/2

5. Con los datos de la muestra calcular el valor del estadstico 6. Si el valor del estadstico de prueba cae en la regin de rechazo, la decisin es rechazar Ho en favor de Ha. Pero, si el valor no cae en esta regin crtica, se dice que no hay evidencia suficiente para rechazar Ho. En este caso es preferible abstenerse de aceptar Ho como verdadera pues esto puede introducir el error tipo II

Ejemplo De una poblacin normal se tom una muestra aleatoria y se obtuvieron los siguientes resultados: 15, 17, 23, 18, 20. Probar con una significancia de 10% que la media de la poblacin es mayor a 18 Solucin 1. Ho: = 18 2. Ha: >18

3. Nivel de significancia de la prueba = 0.10 4. Estadstico de prueba

213

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

T=

X o s/ n

, tiene distribucin T con = n 1 grados de libertad

1 (15+17+23+18+20)=18.6 5 1 S2 = ((15-18.6)2 + (17-18.6)2 + ... ) = 9.3 S = 3.05 4 x=

Regin de rechazo de Ho = 0.1 , = 5 1 = 4 t0.1 = 1.53 Rechazar Ho si t > 1.53 5. t =

con la tabla T

18.6 18 3.05 / 5

= 0.44

0.44 no cae en la regin de rechazo

6. Decisin No hay evidencia suficiente para rechazar que la media poblacional es 18.

EJERCICIOS
1) Una muestra aleatoria de 10 observaciones tomada de una poblacin con distribucin normal produjo una media 2.5 y una desviacin estndar 0.28. Suponga que se desea demostrar que la media poblacional es mayor a 2.3 a) Enuncie la hiptesis nula para la prueba b) Enuncie la hiptesis alterna para la prueba c) Use su intuicin para predecir si el valor de la media muestral es suficiente evidencia para afirmar que la media poblacional es mayor que el valor propuesto d) Realice la prueba de hiptesis con un nivel de significancia de 5% y determine si los datos son evidencia suficiente para rechazar la hiptesis nula en favor de la hiptesis alterna. 2) El peso de seis artculos de una muestra aleatoria tomada de la produccin de una fbrica fueron: 0.51, 0.59, 0.52, 0.47, 0.53, 0.49 kg. Pruebe si estos datos constituyen una evidencia suficiente para afirmar que el peso promedio de todos los artculos producidos por la fbrica es mayor a 0.5 Kg. Encuentre el valor p o nivel de significancia de la prueba. Suponga distribucin normal.

MATLAB
Prueba de hiptesis relacionada con la media, n < 30 >> x = [15 17 23 18 20]; >> [h, p, ci, t] = ttest(x, 18, 0.1, 1) h= 0 p= 0.3414 ci = 16.5090 Inf t= tstat: 0.4399 df: 4 Valor p de la prueba Intervalo de confianza con nivel 1 Valor del estadstico de prueba Grados de libertad h=0 La evidencia no es suficiente para rechazar Ho Vector con los datos de la muestra Prueba Ho: =18 vs. Ho: >18 = 0.1. Prueba unilateral derecha

214

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.5.3 VALORP DE UNA PRUEBA DE HIPTESIS


El Valorp de una prueba de hiptesis, o probabilidad de cola, es el valor del rea de la cola (o colas), a partir del valor observado y representa el nivel de significancia obtenido con la muestra. Si esta probabilidad es pequea, es un indicativo de que los datos de la muestra no apoyan a la hiptesis nula propuesta pues el valor del estadstico de pruebase ubica lejos del valor propuesto para el parmetro. Pero si esta probabilidad es grande, significa que los datos de la muestra no contradicen a la hiptesis nula, pues el valor del estadstico se ubica cerca del parmetro

Ejemplo Una muestra aleatoria de 100 paquetes mostr un peso promedio de 71.8 gr. con una desviacin estndar de 8.9 gr. Pruebe que el peso promedio de todos los paquetes (poblacin) es mayor a 70 gr. El nivel de significancia no est especificado, por lo tanto lo obtenemos con los datos de la muestra Hiptesis nula Hiptesis alterna Ho: = 70 Ha: > 70

Valor del estadstico de prueba X o 71.8 70 = 2.02 Z= / n 8.9 / 100

Probabilidad de cola P = P(Z 2.02) = 1 F(2.02) = 1 0.9783 = 0.0217 = 2.17% Se puede concluir que la prueba tiene una significancia de 2.17% Este valor se denomina Valorp de la prueba o probabilidad de cola.

215

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.5.4 CLCULO DEL ERROR TIPO I


El error tipo I es igual al nivel de significancia de la prueba y representa el error en que se incurrir al rechazar Ho con la evidencia de la muestra, sin conocer que Ho es verdadera. Suponga que se define la siguiente hiptesis relacionada con la media, con una muestra grande. Ho: = 0 (Hiptesis Nula) > 0 (Hiptesis alterna) Ha: : (Nivel de significancia o error tipo I) Z>z (Regin de rechazo) La regin de rechazo est definida con el valor crtico z que se obtiene del valor especificado . La regin de rechazo tambin puede definirse proponiendo un valor crtico c para X , entonces el nivel de significancia o error tipo I de la prueba es Definicin: Error tipo I o nivel de significancia de la prueba

= P( X > c) = P(Z >

c 0 / n

)
c 0 / n
c = 0 + z ( /

Los valores z y c estn relacionados directamente: z =

n)

Para facilitar la comprensin del concepto se ha graficado tambin X con distribucin normal

Ejemplo. X es una variable aleatoria con distribucin normal y varianza 49. Se plantea el siguiente contraste de hiptesis Ho: = 15 vs Ha: > 15 y se ha especificado como regin de rechazo de Ho que la media X de todas las muestras con n=40 tengan un valor mayor a 17 Encuentre la medida del error tipo I Error tipo I: = P( X >c) = P( X >17)= P(Z >

c 0 / n

)= P(Z >

17 15 7 / 40

)=P(Z>1.807) 0.04

216

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.5.5 CLCULO DEL ERROR TIPO II El error tipo II se representa por , y se usa para cuantificar el error en que se incurrir al aceptar Ho: =0 cuando la evidencia de la muestra no es suficiente para rechazarla, sin saber que el verdadero valor de la media es algn otro valor 1. Para entender el concepto
usamos un caso particular

Caso
Ho: Ha: :

= 0 > 0

(Hiptesis nula) (Hiptesis alterna) (Nvel de significancia)

Para calcular el valor de debemos suponer que hay otro valor verdadero para el parmetro . Sea 1 el valor que suponemos verdadero. Entonces es la probabilidad (rea a la izquierda) del valor crtico c calculada con este valor 1. Definicin: Error tipo II

= P(X < c)=1 = P(Z <

c 1 ) / n

2) Con z se obtiene c 3) Con c y 1 se obtiene

1) Con se obtiene z

Ejemplo.Suponga que se define la siguiente hiptesis relacionada con la media. Muestra: n =100, X =71.8, S = 8.9 = 70 (Hiptesis Nula) Ho: > 70 (Hiptesis alterna) Ha: : 5% (Nivel de significancia) Calcule la magnitud del error tipo II suponiendo que la media poblacional verdadera es = 73

217

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Solucin Regin de rechazo de H0 = 0.05 z = z0.05 = 1.645

z > 1.645

Calculemos el valor crtico c de X para la regin de rechazo:

z =

c 0 / n

c = 0 + z ( / n ) = 70 + 1.645 ( 8.9 / 100 ) = 71.46

= P(Aceptar Ho dado que la hiptesis verdadera es: = 1 ) = P( X < c ) con = 1 c 1 71.46 73 = P(Z < ) = P(Z < ) = P(Z < 1.73) = 4.18% (Error tipo II con = 73) 8.9 / 100 s/ n Se concluye que la probabilidad de aceptar = 70 siendo falsa es 4.18% si = 73 es verdadera. 10.5.6 CURVA CARACTERSTICA DE OPERACIN Si se grafican los puntos de para algunos valores de y se traza una curva, el grfico
resultante se denomina Curva Caracterstica de Operacin. Esta curva es utilizada como criterio en estudios de control de calidad.

10.5.7 POTENCIA DE LA PRUEBA


La potencia de una prueba estadstica es un concepto relacionado con el error tipo II. Suponga que se define la siguiente hiptesis relacionada con la media: Ho: = 0 Ha: > 0 Clculo del error tipo II: = P(Aceptar Ho dado que otra hiptesis es verdadera: = 1 )

218

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Si la muestra es grande, entonces:

= P(X < c)=1 = P(Z <

c 1 ) / n

En donde c es el valor crtico de X con el que se acepta o rechaza Ho: Es posible calcular para otros valores = 1, 2, 3,... por lo tanto, es una funcin de . El complemento de () es otra funcin de y se denomina Potencia de la Prueba K(): Definicin: Potencia de la prueba K() = 1 - () Si mide la probabilidad de aceptar una hiptesis falsa, entonces la potencia de la prueba K mide la probabilidad de rechazar una hiptesis falsa. El grfico de K() representa la probabilidad de rechazar la hiptesis nula dado que es falsa, para diferentes valores de

Ejemplo Se conoce que la estatura de la poblacin en cierto pas puede ser modelada como una variable aleatoria normal con media desconocida y desviacin estndar = 0.04 m. Para inferir el valor desconocido de la media se plantea el siguiente contraste de hiptesis: Ho: = 1.7 vs. H1: < 1.7, y se define la regin crtica como: n R = {(x1, x2, . . ., xn) | x1 + x2 + . . . + xn < k} Determine k y n si se requiere que el nivel de significancia o error tipo I sea 0.01, y que la potencia de la prueba sea igual a 0.98 cuando = 1.67 Solucin Modelo poblacional: Hiptesis nula Hiptesis alterna X N(, 0.042) Ho: = 1.7 H1: < 1.7 (H1, es la hiptesis alterna)
n

La regin crtica R = {(x1, x2, . . ., xn) | x1 + x2 + . . . + xn < k} establece que todas las muestras de tamao n deben cumplir que x1 + x2 + . . . + xn < k La especificacin: x1 + x2 + . . . + xn < k si se divide para n es equivalente a especificar que la regin crtica o de rechazo es: x < k/n. Sea c = k/n Los clculos se describen a continuacin:

219

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Error tipo I:

= 0.01

= 0.01 = P(Z < -z) = P( X < c)


= P( Z < 0.001 = P( Z < ) / n c 1.7

con = 1.7 )

c 1.7 0.04 / n

0.04 / n

= -2.33

(1)

Con la tabla Z

En donde c = k/n es el valor crtico de X que define a la regin de rechazo de Ho K= 0.98 cuando = 1.67

Potencia de la prueba:

K = 0.98, con = 1.67 Error tipo II: = 1 K = 1 0.98 = 0.02, con = 1.67

= 0.02 = P(Z > -z)

con = 1.67 = P( X > c) con = 1.67 c = P( Z > ) con = 1.67 / n c 1.67 ) 0.02 = P( Z > 0.04 / n c 1.67 c 1.67 0.98 = P( Z ) = 2.055 0.04 / n 0.04 / n

(2)

Con la tabla Z

220

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Al resolver las dos ecuaciones: c 1.7 (1) = -2.33 0.04 / n c 1.67 = 2.055 (1) 0.04 / n Se obtiene c = 1.684, n = 34.3 35 k = nc = 58.94

Ejemplo Un modelo para la describir el error en la calibracin de una mquina es que sea N(, 42) Se postula el siguiente contraste de hiptesis Ho: =250 vs. H1: > 250 Determine el tamao de la muestra n y la cantidad c para que la regin crtica R de la muestra sea R = {(X1, X2, . . . , Xn) | X > c} Se requiere que el nivel de significancia o error tipo I de la prueba sea 0.0329, y que el error tipo II sea 0.0228 cuando valga 252. Solucin Modelo poblacional: X N(, 42), = 42 = 4
2

Hiptesis nula Ho: = 250 Hiptesis alterna H1: > 250 La regin crtica R = {(X1, X2, . . . , Xn) | X > c} establece que todas las muestras de tamao n deben cumplir que su media aritmtica X sea mayor a c Nivel de significancia de la prueba o Error Tipo I: = 0.0329

= 0.0329 = P(Z > z)


= P( X > c) c = P( Z > ) con = 250 / n c 250 ) 0.0329 = P( Z > 4/ n

221

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

0.9671 = P( Z

c 250 4/ n

c 250 4/ n

= 1.84

(1)

Con la tabla Z

Error tipo II:

= 0.0228 con = 252

= 0.0228 = P(Z z)

= P( X c) c = P( Z ) con = 252 / n c 252 c 252 0.0228 = P( Z ) = 2.09 (2) 4/ n 4/ n Al resolver las ecuaciones c 250 (1) = 1.84, 4/ n Se obtienen

con = 252 con = 252

Con la tabla Z

(2)

c 252 4/ n

= 2.09

c = 250.936, n = 61.78 62

Calcule la potencia de la prueba para entre 247 y 253. Calcule al menos diez valores

= P(Z z)

= P( X c) = P( X 250.936) c = P( Z ) con = 247 / n 250.936 247 ) = P( Z 4 / 62 = P(Z 7.748) = F(7.748) 1

con = 247 con = 247 con = 247

K=1=11 =0
Siguiendo este procedimiento con los otros valores de , se obtienen los resultados que se muestran en el cuadro ms abajo

222

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

247.0 247.5 248.0 248.5 249.0 249.5 250.0 250.5 251.0 251.5 252.0 252.5 253.0

z
7.7480 6.7638 5.7795 4.7953 3.8110 2.8268 1.8425 0.8583 -0.1260 -1.1102 -2.0945 -3.0787 -4.0630

1.000 1.000 1.000 1.000 1.000 0.997 0.967 0.804 0.450 0.133 0.018 0.001 0.000

K=1
0.000 0.000 0.000 0.000 0.000 0.003 0.033 0.196 0.550 0.867 0.982 0.999 1.000

Grfico de la potencia de la prueba

K()

Ejemplo 2 De una poblacin XN(, 7 ), (significa que la variable X tiene distribucin normal con media 2 y varianza 7 ), se ha tomado una muestra aleatoria de tamao n para realizar la prueba de hiptesis: Ho: = 15 > 15 Ha: Siendo la regin crtica X > c Se requiere que la potencia de la prueba tome el valor 0.8 cuando = 17, y que la potencia de la prueba tome el valor 0.95 cuando = 18. Determine los valores de n, c

223

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Solucin Primero obtenemos los valores respectivos de

17 18

K
0.8 0.95

=1-K
0.2 0.05

Usamos la frmula para calcular : Con = 17:

= P(X < c)=1 = P(Z <


c 17 7/ n

c 1 ) / n

= P(X < c)=17 = P(Z<


0.2 = F(

) = F(

c 17 7/ n

c 17 7/ n

c 17 7/ n

= -0.84

(1)

Con la tabla Z

Con = 18:

= P(X < c)=18 = P(Z<


0.05 = F(

c 18 7/ n

) = F(

c 18 7/ n

c 18 7/ n

c 18 7/ n

= -1.65

(2)

Con la tabla Z

Resolviendo estas dos ecuaciones: c 17 = -0.84 (1) 7/ n Se obtiene n 32, c = 15.96

(2)

c 18 7/ n

= -1.65

Calcule el nivel de significancia de la prueba , o error tipo I Solucin

= P(X > c)= = P(Z >


0

c 0 7/ n

) = P(Z >

15.96 15 7 / 32

) = 1 F(0.7758) 0.22

Calcule y grafique la potencia de la prueba con = 12, 13, ..., 19 Solucin

K() = 1 ( ) = 1 P(X < c)=1 = 1 P(Z <


Valores calculados:

15.96 1 7 / 32

12 13 14 15 16 17 18 19

1 0.991 9.943 0.781 0.487 0.200 0.049 0.007

K=1-
0 0.009 0.057 0.219 0.513 0.800 0.951 0.993

224

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
Una variable aleatoria X tiene distribucin normal con varianza 49. Se plantea el siguiente contraste de hiptesis: Ho: = 15 vs Ha: > 15 n La regin crtica para rechazar Ho es R = {(X1, X2, . . . , Xn) | X > c}. Esto significa que la media muestral X debe ser mayor a c para todas las muestras aleatorias reales de tamao n tomadas de la poblacin. Se desea que el error tipo I sea 0.05, y que el error tipo II sea 0.04 cuando = 17 a) Determine c y n b) Calcule y grafique la potencia de la prueba con = 13.0, 13.5, 14.0, 14.5, 15.0, 15.5, 16.0

225

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Potencia de la prueba Resolver el sistema de ecuaciones del ltimo ejemplo c 17 c 18 (1) = -0.84 (2) = -1.65 7/ n 7/ n

>> [c,n]=solve('(c-17)/(7/sqrt(n))=-0.84','(c-18)/(7/sqrt(n))=-1.65') c= 15.9629 n= 32.1489


Graficar la curva de la potencia de la prueba para el ltimo ejemplo >> mu = 12:19 Valores de

mu = 12 13 14 15 16 17 18 19 >> beta = normcdf((15.96 - mu)/(7/sqrt(32))) Valores de () beta = 0.9993 0.9916 0.9434 0.7811 0.4871 0.2003 0.0496 >> k = 1- beta k= 0.0007

0.0070

Valores de k() = 1 - ()

0.0084

0.0566

0.2189

0.5129

0.7997

0.9504

0.9930

>> plot(mu,k,'ob'),grid on,hold on >> plot(mu,k,'b')


>> legend('Potencia de la prueba K(mu)',2)

Grfico de los puntos k() Grfico de las lneas de k()

226

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.6 INFERENCIAS RELACIONADAS CON LA PROPORCIN


En muchas aplicaciones interesa conocer el valor de un ndice, tasa, etc., que representan la proporcin de datos que consideramos favorables del total de datos en la poblacin. En estas situaciones se utiliza como modelo la distribucin binomial. Para usar este modelo se supone conocido el valor de probabilidad p. Por lo tanto, es de inters prctico conocer o al menos estimar el valor de este parmetro poblacional p. La variable aleatoria con distribucin binomial tiene media = np y varianza = npq.
2

De esta poblacin se toma una muestra de tamao n y se obtienen x datos favorables. La relacin x/n se denomina proporcin muestral

p y es un estimador para el parmetro p.

Caso n 30 (Muestras grandes) La variable aleatoria p =x/n es la media muestral. Esta variable es un estimador insesgado, es decir su media es igual al parmetro de inters p
Demostracin Media de

p: p:

p = E( p ) = E(X/n) = 1/n E(X) = 1/n (np) = p


2p = V( p ) = V(X/n) = 1/n2 V(X) = 1/n2 (npq) =
pq n

Varianza de

10.6.1 ESTIMACIN PUNTUAL


Parmetro: p (Es la medida poblacional cuyo valor se desea estimar) 2 Poblacin con distribucin binomial con media y varianza desconocidas

p =x/n (Proporcin muestral, se usa para estimar al parmetro) Muestras grandes (n 30). Entonces, por el teorema del lmite central, el estadstico p - p tendr aproximadamente distribucin normal estndar. Z= p
Estimador:

FRMULA PARA ESTIMACIN PUNTUAL DE LA PROPORCIN


Se desarrolla un anlisis similar al realizado para la media muestral cuando n 30 . Suponer especificado un valor de probabilidad centrado 1 La desigualdad - z/2 Z z/2 se satisface con probabilidad 1 Equivale a decir que | Z | z/2 Sustituyendo Z se obtiene: | tiene probabilidad 1

p-p | z/2 con probabilidad 1 pq/n

227

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

pq con probabilidad 1 n | p p | es el error en la estimacin de p mediante p


De donde | p p | z/2 Definicin: Estimacin puntual de la proporcin, n 30

E = z/2

pq es el mximo error en la estimacin de p con probabilidad 1 - n

Para poder evaluarlo, se usa la varianza muestral como aproximacin:

pq pq n n

10.6.2 ESTIMACIN POR INTERVALO


Parmetro: p (Es la medida poblacional cuyo valor se desea estimar) 2 Poblacin con distribucin binomial con media y varianza desconocidas

p =x/n (Proporcin muestral) Muestras grandes (n 30). Entonces, por el teorema del lmite central, el estadstico p - p tendr aproximadamente distribucin normal estndar. Z= p
Estimador:

FRMULA PARA ESTIMACIN POR INTERVALO DE LA PROPORCIN


En la misma desigualdad anterior: - z/2 Z z/2 con probabilidad 1 - Sustituimos Z =

p-p y despejamos del numerador el parmetro p pq n

Definicin: Estimacin por intervalo para la proporcin Intervalo de confianza para p con nivel 1 - , con una muestra de tamao n 30,

p z/2

pq pq p p + z/2 n n

Para poder evaluarlo, se usa la varianza muestral como aproximacin:

pq pq n n

228

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo En un estudio de mercado para un producto se tom una muestra aleatoria de 400 personas de las cuales 140 respondieron favorablemente. Encuentre el error mximo en la estimacin con probabilidad de 95%

1 = 0.95 z/2 = z0.025 = 1.96 p = 140/400 = 0.35 E = z/2

pq (0.35)(0.65) 1.96 = 4.67% 400 n

Encuentre un intervalo de confianza para p con un nivel de 95%

p z/2

pq pq p p + z/2 n n
(0.35)(0.65) 400

0.35 1.96

p 0.35 + 1.96

(0.35)(0.65) 400

0.303 p 0.397 Se puede afirmar con una confianza del 95% que la proporcin de personas en la poblacin que favorecen al producto est entre 30.3% y 39.7%

10.6.3 PRUEBA DE HIPTESIS


Parmetro: p (Es la medida poblacional cuyo valor se desea estimar) 2 Poblacin con distribucin binomial con media y varianza desconocidas

p =x/n (Proporcin muestral) Muestras grandes (n 30). Valor propuesto para el parmetro: p0
Estimador:

PROCEDIMIENTO BSICO
1) Formular la hiptesis nula: Ho: p = p0 (algn valor especfico para p) 2) Formular una hiptesis alterna, elegir una entre: Ha: p < p0 Ha: p > p0 Ha: p p0 3) Especificar el nivel de significancia para la prueba

229

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

4) Seleccionar el estadstico de prueba y definir la regin de rechazo

z=
Ha

p - p0 p0q0 n

por el teorema del lmite central tiene distribucin normal estndar

Regin de rechazo de Ho en favor de Ha

p < p0 p > p0 p p0

z < -z z > z z <-z/2 z > z/2

5) Con los datos de la muestra calcule el valor del estadstico 6) Si el valor del estadstico de prueba cae en la regin de rechazo, la decisin es rechazar Ho en favor de Ha. Caso contrario, se dice que no hay evidencia suficiente para rechazar Ho.

Ejemplo La norma de artculos aceptables producidos por una fbrica es 90%. Se ha tomado una muestra aleatoria de 175 artculos y se encontraron 150 artculos aceptables. Pruebe con una significancia de 5% que no se est cumpliendo con la norma Solucin Sea p: proporcin de artculos aceptables que produce la fbrica

p = x/n = 150/175 = 0.857 = 85.7% Es esto una evidencia de que p < 90% o puede atribuirse nicamente a la aleatoriedad de los
datos, con 5% de probabilidad de equivocarnos? 1) 2) 4) Ho: p = 0.9 Ha: p < 0.93) Nivel de significancia de la prueba = 0.05 Estadstico de prueba

z=

p - p0 p0q0 n

Regin de rechazo de Ho = 0.5 , z = z0.05 = 1.645 Rrechazar Ho si z < -1.645

5)

z=

p - p0 p0q0 n

0.857- 0.9 (0.9)(0.1) 175

= -1.869 z < -1.645

6)

Decisin: Hay evidencia suficiente para afirmar que, con una significancia de 5%, no se cumple la norma

230

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) Se ha tomado una muestra aleatoria de 200 artculos producidos por una empresa y se observ que 175 fueron aceptables. Encuentre un intervalo de confianza de 95% para la proporcin de artculos aceptables. 2) Una muestra aleatoria de 400 observaciones produjo 150 resultados considerados xitos. Es de inters para una investigacin probar que la proporcin de xitos difiere de 0.4 a) Proponga la hiptesis nula y la hiptesis alterna b) Realice una prueba para determinar si hay evidencia suficiente para rechazar la hiptesis nula en favor de la hiptesis alterna, con 10% de significancia. 3) Una empresa realiz un estudio de mercado de su producto para lo cual consult a 200 consumidores. 28 expresaron su preferencia por el producto de la empresa. El fabricante cree, con este resultado que tiene el 10% del mercado para su producto. Pruebe con 5% de significancia si esta afirmacin es correcta.

231

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.7 INFERENCIAS RELACIONADAS CON LA VARIANZA


Para algunas pruebas y aplicaciones estadsticas, es importante estimar el valor de la varianza 2 poblacional . Suponer una poblacin con distribucin normal o aproximadamente normal de la cual se toma una muestra aleatoria de tamao n y se obtiene la varianza muestral S2: 1 n 1 n S2 = (Xi X)2 , X = Xi n i=1 n 1 i=1 El estadstico S2 es un estimador insesgado del parmetro pues se puede demostrar que, 2 E(S2) =
2

La varianza de la varianza muestral S2 se puede demostrar que es 2 4 V(S2) = ,n>1 n1 Parmetro: (Es la medida poblacional cuyo valor se desea estimar) Poblacin con distribucin normal Estimador: S2 (Varianza muestral, se usa para estimar al parmetro
2

El estadstico para realizar inferencias es =


2

(n 1)

S2 que tiene distribucin 2

Ji-cuadrado con =n1 grados de libertad

10.7.1 INTERVALO DE CONFIANZA


Para definir un intervalo de confianza, se sigue un procedimiento similar a otros parmetros. Definimos un intervalo central para la variable con rea o probabilidad 1 - , y la diferencia se reparte a ambos lados en dos reas iguales con valor /2.
2

Debido a que la distribucin de es asimtrica, los valores de esta variable no tienen la misma 2 2 distancia desde el centro y se los representa con 1 / 2 y / 2 de acuerdo a la definicin establecida para uso de la tabla Ji cuadrado.
2

Entonces, con probabilidad 1 - se tiene el intervalo para 2 2 2 1 / 2 / 2

232

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Si se sustituye la definicin de la variable aleatoria = (n-1)


2

S2 2

y se despeja el parmetro de

inters se obtiene
2

Definicin: Intervalo de confianza para con nivel 1 -


2

(n 1)

S2 2 /2

2 (n 1)

S2
2 1 / 2

Ejemplo En una muestra aleatoria se registr el peso de 10 paquetes y se obtuvieron los siguientes resultados en gramos: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 41.9, 45.2, 46.0
Encuentre un intervalo de confianza para la varianza del peso de toda la produccin, con un nivel de 95%. Suponga que la poblacin tiene distribucin normal

n = 10, S2 =

X=

1 n 1 Xi = 10 [46.4 + 46.1 + ... ] = 45.62 n i=1

1 n 1 (Xi X)2 = 9 [(46.4 45.62)2 + (46.1 45.62)2 + ... ] = 1.919 n 1 i=1


1 = 0.95, = n 1 = 9

2 2 / 2 = 0.025 = 19.02 2 2 1 / 2 = 0.975 = 2.7

(Tabla 2) (Tabla 2)

Se sustituye en la definicin del intervalo de confianza: 2 2 9 (1.919/19.02) 9 (1.919/2.7) 0.908 6.398 Se puede afirmar con una confianza de 95% que la varianza poblacional se encuentra en el intervalo [0,908, 6.398]

10.7.2 PRUEBA DE HIPTESIS


Se usa el mismo procedimiento bsico para los parmetros estudiados anteriormente: 2 1) Definir la hiptesis nula Ho: 2 = o (algn valor especificado) 2 Ha: 2 < o 2) Elegir una hiptesis alterna: 2 Ha: 2 > o 2 Ha: 2 o

233

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

3) 4)

Seleccionar el nivel de significancia Estadstico de prueba S2 2 = (n-1) , distribucin ji-cuadrado con = n-1 grados de libertad 2 o Regin crtica

Ha
2

5) 6)

Regin de rechazo de Ho en favor de Ha 2 2 < o 2 < 1 2 2 2 2 > > o 2 2 2 2 2 2< 1 o / 2 > / 2 Calcular el valor del estadstico de prueba con los datos de la muestra Tomar una decisin.

Ejemplo Un fabricante afirma que la duracin de su producto tiene distribucin aproximadamente normal con una desviacin estndar de 0.9 aos.
Una muestra aleatoria de 10 productos tuvo una desviacin estndar de 1.2 aos. Pruebe, con una significancia de 5%, si esta evidencia es suficiente para afirmar que la desviacin estndar poblacional es mayor a la especificada La prueba es aplicable a la varianza 1) 2) 3) 4)
2 2

por lo tanto = (0.9)2 = 0.81


2

5) 6)

Ho: = 0.81 2 Ha: > 0.81 = 0.05 Estadstico de prueba S2 2 = (n-1) , distribucin ji-cuadrado con = n-1 grados de libertad 2 o Regin de rechazo =0.05, = n -1 = 9, 2 0.05 = 16.91 Rechazar Ho si 2 > 16.91 S2 (1.2)2 2 = (n-1) =9 =16.0 0.81 2 o Con una significancia de 5%, se puede concluir que no hay evidencia suficiente para rechazar la afirmacin del fabricante

234

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) Se tom una muestra aleatoria de 15 observaciones de una poblacin normal y se obtuvo que la media y la varianza muestrales fueron respectivamente 3.92 y 0.325. Encuentre un intervalo de confianza de 90 para varianza de la poblacin. 2) Una muestra aleatoria de 20 observaciones tomada de una poblacin normal produjo una varianza muestral igual a 18.2. Determine si los datos proporcionan suficiente evidencia para afirmar que la varianza poblacional es mayor a 15. Haga la prueba con 5% de significancia. 3) El fabricante de un artculo afirma que la resistencia media de su artculo tiene distribucin normal con una desviacin estndar de 0.5. Una muestra aleatoria 4 observaciones produjo los siguientes resultados de su resistencia: 5.2 4.3 3.7 3.9 5.7. Realice una prueba con 5% de sigificancia para determinar si la desviacin estndar especificada por el fabricante es cierta. 4) Un fabricante de cables de cobre afirma que la resistencia de su producto tiene distribucin normal con varianza de 100. Al probar la resistencia de cuatro artculos de una muestra aleatoria se obtuvieron los siguientes resultados: 130, 152, 128, 145. Pruebe con una significancia de 5% que la varianza excede a la especificacin.

MATLAB
Obtencin de un intervalo de confianza para la varianza
Vector conteniendo una muestra de diez datos
2

>> u=[46.4 46.1 45.8 47.0 46.1 45.9 45.8 41.9 45.2 46.0]; Varianza muestral >> v=var(u) v= 1.9196 >> ja=chi2inv(0.975,9) Valor del estadstico 2 para = 0.025, = 9 ja = 19.0228 >> j1a=chi2inv(0.025,9) Valor del estadstico 2 para = 0.975, = 9 j1a = 2.7004 2 >> x=[9*v/ja, 9*v/j1a] Intervalo de confianza bilateral para x= 0.9082 6.3976

235

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.8 INFERENCIAS RELACIONADAS CON LA DIFERENCIA ENTRE DOS MEDIAS


10.8.1 ESTIMACIN PUNTUAL E INTERVALO DE CONFIANZA CASO: Muestras grandes (n30)
En esta seccin se desarrolla la tcnica para comparar las medias de dos poblaciones. Supongamos dos poblaciones de las cuales se toman muestras aleatorias independientes para usar la diferencia de las medias muestrales como una estimacin de las medias poblacionales.

Diferencia de medias poblacionales Parmetro: 1 - 2 2 Poblaciones con distribuciones desconocidas, con varianzas 1 , 2 2 Estimador: X1 - X2 Diferencia de medias muestrales Muestras aleatorias independientes de tamaos n1 y n2 mayores o iguales a 30 Media y varianza del estimador::

x 1 x 2 = E( X1 - X2 ) = E( X1 ) E( X2 ) = 1 - 2

(Es un estimador insesgado)

2 1 2 + 2 n1 n2 Adicionalmente, pueden aproximarse las varianzas poblacionales con las varianzas 2 2 2 1 muestrales: S1 , 2 2 S2

= V( X1 - X2 ) = V[(1) X1 + (-1) X2 ] = (1)2V( X1 ) + (-1)2V( X2 ) = 2 X1 X 2

Siendo las muestras grandes, por el teorema del lmite central, el estadstico
Z= (x1 x 2 ) x1 x2 x1 x 2

(x1 x 2 ) (1 2 )
2 1 2 + 2 n1 n2

tiene distribucin normal estndar aproximadamente,

236

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Con un planteamiento similar al realizado en casos anteriores se tiene

Z=

(x1 x 2 ) (1 2 )
2 1 2 + 2 n1 n2

Con probabilidad 1 - , se cumple la desigualdad: -z/2 Z z/2 Sustituyendo Z y con la definicin de error en la estimacin se obtiene: Definicin: Error mximo en la estimacin de 1 - 2 con probabilidad 1 - E=
2 2 z /2 1 + 2

n1

n2

Sustituyendo Z y despejando el parmetro de inters 1 - 2 se obtiene:

Definicin: Intervalo de confianza para 1 - 2 con nivel 1 - ( X1 - X 2 ) 2 2 z /2 1 + 2 2 2 1 - 2 ( X1 - X2 ) + z /2 1 + 2

n1

n2

n1

n2

Ejemplo De dos poblaciones, 1 y 2, se tomaron muestras aleatorias independientes y se obtuvieron los siguientes resultados: Muestra 1 2 n 36 49
x 12.7 7.4

S2 1.38 4.14

Encuentre el mayor error en la estimacin puntual de 1 - 2 con probabilidad 95%

1- = 0.95 z/2 = z0.025 = 1.96. Sustituimos en la frmula: E=


2 2 z /2 1 + 2 1.96 1.38 + 4.14 = 0.687

n1

n2

36

49

237

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Encuentre un intervalo de confianza para 1 - 2 con nivel 95% Sustituimos en la frmula respectiva:

(12.7 - 7.4) 1.96 4.613 1 - 2

1.38 4.14 + 36 49 5.987

1 - 2 (12.7 - 7.4) + 1.96 1.38 + 4.14


36 49

Con los datos de las muestras se puede afirmar con una confianza de 95% que 1 es mayor a 2 en un valor que puede ir desde 4.613 hasta 5.987

10.8.2 PRUEBA DE HIPTESIS CASO: Muestras grandes (n30)


PROCEDIMIENTO BSICO
1) Formular la hiptesis nula: Ho: 1 - 2 = d0 (usualmente d0=0)

2) Formular una hiptesis alterna, elegir una entre: Ha: 1 - 2 < d0 Ha: 1 - 2 > d0 Ha: 1 - 2 d0 3) Especificar el nivel de significancia para la prueba 4) Seleccionar el estadstico de prueba y definir la regin de rechazo de Ho

Z=

(x1 x 2 ) d0
2 1 2 + 2 n1 n2

tiene distribucin normal estndar aproximadamente

2 2 2 S1 , 2 Adicionalmente: 1 2 S2

Ha

Regin de rechazo de Ho en favor de Ha

1 - 2 < d0 1 - 2 > d0 1 - 2 d0

z < -z z > z z<-z/2 z > z/2

5) Con los datos de la muestra calcule el valor del estadstico 6) Si el valor del estadstico de prueba cae en la regin de rechazo, la decisin es rechazar Ho en favor de Ha. Caso contrario, se dice que no hay evidencia suficiente para rechazar Ho.

238

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo. Suponga los siguientes datos correspondientes a dos muestras aleatorias independientes tomadas de dos poblaciones cuyas medias se desea estudiar muestra 1 2 n 75 50
x 82 76

S2 64 36

Pruebe la hiptesis 1 > 2 con un nivel de significancia de 10%

Solucin 1) Ho: 1 - 2 = 0 2) Ha: 1 - 2 >0 3) = 0.1 (x x 2 ) d0 4) Z= 1 2 1 2 + 2 n1 n2 5) z = 1.28: Rechazar Ho si z > 1.28 (82 76) 0 = 4.78 Z= 64 36 + 75 50
Con una significancia de 10% se acepta que 1 > 2

6)

EJERCICIOS
De dos poblaciones se tomaron muestras aleatorias independientes y se obtuvieron los siguientes resultados:

Muestra 1 2

n 36 45

x 1.24 1.31

S2 0.056 0.054

a) Encuentre un intervalo de confianza para 1 - 2 con nivel 90%. b) Con una significancia de 5% realice una prueba para determinar si la evidencia de las muestras es suficiente para afirmar que las medias poblacionales son diferentes.

239

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.8.3 INTERVALO DE CONFIANZA Caso: Muestras pequeas (n<30)


En esta seccin se desarrolla la tcnica para comparar las medias de dos poblaciones. Supongamos dos poblaciones de las cuales se toman muestras aleatorias independientes para usar la diferencia de las medias muestrales como una estimacin de las medias poblacionales. Parmetro: 1 - 2 Diferencia de medias poblacionales 2 Poblaciones con distribuciones normales, con varianzas 1 , 2 2 desconocidas Estimador: X1 - X2 Diferencia de medias muestrales Muestras aleatorias independientes de tamaos n1 y n2 menores a 30 Media del estimador x 1 x 2 = E[ X1 - X2 ] = E[ X1 ] - E[ X2 ] = 1 - 2 Estadstico de prueba (X X ) (1 2 ) T= 1 2 , distribucin T SX1 X 2
2 , 2 fuesen conocidas teniendo las poblaciones Nota: Si las varianzas poblacionales 1 2 distribucin normal el estadstico tendra distribucin normal estndar, sin importar el tamao de las muestras

(Estimador insesgado)

La teora estadstica provee adicionalmente una prueba para verificar estas suposiciones acerca de las varianzas, la misma que se estudiar posteriormente.
2 = 2 Se analizan dos situaciones acerca de las varianzas: 1 2

2 2 1 2 .

a)

2 1 = 2 2

Estadstico de prueba (X X ) (1 2 ) T= 1 2 , distribucin T con = n1 + n2 2 grados de libertad SX1 X 2

SX1 X2 = Sp

1 1 + , n1 n2

2 Sp =

2 2 (n1 1)S1 + (n2 1)S2 n1 + n2 2

240

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Con un planteamiento similar al realizado en casos anteriores:

T=

(X1 X 2 ) (1 2 ) SX1 X2

Con probabilidad 1 , se tiene la desigualdad: -t/2 T t/2 Sustituyendo T y despejando el parmetro de inters 1 - 2 se obtiene: Definicin: Intervalo de confianza para 1 - 2 con nivel 1 - 1 - 2 ( x 1 - x 2 ) + t/2 S X

( x 1 - x 2 ) - t/2 S X

1 X2

1 X2

b)

2 1 2 2

Estadstico de prueba
(X1 X 2 ) (1 2 ) , distribucin T con SX1 X 2
2 S1 S2 2 + n 1 n2 2 2

T=

2 2 S1 S2 n 1 + n2 n1 1 n2 1

grados de libertad

S X1 X 2 =

2 S1 S2 + 2 , n1 n2

Definicin: Intervalo de confianza para 1 - 2 con nivel 1 - 1 - 2 ( x 1 - x 2 ) + t/2 S X

( x 1 - x 2 ) - t/2 S X

1 X2

1 X2

241

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.8.4 PRUEBA DE HIPTESIS Caso: Muestras pequeas (n<30) a)


2 1 = 2 2

1) Ho: 1 - 2 = d0 2) Ha: 1 - 2 < d0

(usualmente d0 = 0)

1 - 2 > d0 1 - 2 d0

3) : nivel de significancia 4) Estadstico de prueba y regin de rechazo (X X ) d0 t= 1 2 , distribucin T con = n1 + n2 2 grados de libertad S X1 X 2

SX1 X2 = Sp
Ha

1 1 , + n1 n2

2 Sp =

2 2 (n1 1)S1 + (n2 1)S2 n1 + n2 2

Regin de rechazo de Ho

1 - 2 < d0 1 - 2 > d0 1 - 2 d0 b)
2 1 2 2

t < -t t > t t < -t/2 t > t/2

1) Ho: 1 - 2 = d0 2) Ha: 1 - 2 < d0

(usualmente d0 = 0)

1 - 2 > d0 1 - 2 d0

3) : nivel de significancia 4) Estadstico de prueba y regin de rechazo


(X1 X 2 ) d0 , distribucin T con = 2 2 2 2 S X1 X 2 S1 S2 n1 + n2 n1 1 n2 1
2 S1 S2 2 + n 1 n2

T=

grados de libertad

S X1 X 2 =
Ha

2 S1 S2 + 2 n1 n2

Regin de rechazo de Ho

1 - 2 < d0 1 - 2 > d0 1 - 2 d0 242

t < -t t > t t < -t/2 t > t/2

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2 2 = 2 Ejemplo. (Caso 1 ) Se realiz un experimento para comparar la resistencia de dos materiales, obtenindose los siguientes resultados: X S Material n 1 12 85 4 2 10 81 5 Suponga que son muestras aleatorias independientes y que provienen de poblaciones normales con varianzas desconocidas pero que se pueden considerar iguales.

Pruebe con 5% de significancia que la resistencia del material uno excede a la resistencia del material dos en dos unidades. Solucin 1) Ho: 1 - 2 = 2 1 - 2 > 2 2) Ha: = 0.05 3) 4) Estadstico de prueba (X1 X 2 ) d0 T= , distribucin T con = n1 + n2 2 grados de libertad S X1 X 2 Regin de rechazo de Ho = 0.05, = n1 + n2 2 = 12 + 10 2 = 20 t0.05 = 1.725 (Tabla T) t > 1.725 5) Clculo del valor del estadstico de prueba 2 2 (12 1)42 + (10 1)52 (n 1)S1 + (n2 1)S2 2 Sp = 1 = = 20.05 n1 + n2 2 12 + 10 2

S X1 X 2 = Sp
t=
6)

1 1 = + n1 n2

20.05

1 1 + = 1.917 12 10

(X1 X 2 ) d0 (85 81) 2 = = 1.043 S X1 X 2 1.917

t no cae en la regin de rechazo de Ho por lo tanto, con 5% de significancia, no hay evidencia suficiente para rechazar que los materiales tiene igual resistencia.

243

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2 2 2 Ejemplo. (Caso 1 ) Se realiz un experimento para comparar la resistencia de dos materiales, obtenindose los siguientes resultados: X Material n S2 1 15 3.84 3.07 2 12 1.49 0.80

Suponga que son muestras aleatorias independientes y que provienen de poblaciones normales con varianzas desconocidas, suponer diferentes. Encuentre un intervalo de confianza de 95% para la diferencia de las medias poblacionales

1 - 2.
Solucin
3.07 0.80 + 12 15 = = 21 2 2 2 2 2 2 3.07 0.80 S1 S2 n 15 + 12 1 + n2 15 1 12 1 n1 1 n2 1
2 2 S1 S2 + n 1 n2 2
2

1 - = 0.95 /2 = 0.025, = 21, t/2 = t0.025 = 2.08

(Tabla T)

S X1 X 2 =

2 S1 S2 3.07 0.80 + 2 = + = 0.521 15 12 n1 n2

Sustituimos en la frmula respectiva:

( x1

x 2 ) - t/2 S X1 X2 1 - 2 ( x 1 x 2 ) + t/2 S X1 X2

(3.84 - 1.49) - 2.08(0.521) 1 - 2 (3.84 - 1.49) + 2.08(0.521) 1.266 1 - 2 3.434


Por lo tanto, se puede afirmar con una confianza de 95% que la diferencia de las medias de la resistencia de los dos materiales est entre 1.266 y 3.434

EJERCICIOS
De dos procesos de produccin 1 y 2, se tomaron dos muestras aleatorias independientes y se obtuvieron los siguientes resultados del tiempo de produccin de los artculos. Muestra 1: 14, 10, 8, 12 Muestra 2: 12, 9, 7, 10, 6 Suponga que las poblaciones tienen distribucin normal con varianzas aproximadamente iguales a) Encuentre un intervalo de confianza de 95% para 1 2 b) Pruebe con 5% de significancia que 1 > 2

244

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Inferencias relacionadas con dos medias. Muestras pequeas. Varianzas iguales >> x=normrnd(22,3,1,10) Muestra aleatoria X: una fila con 10 cols. X ~ N(22, 3) x= 20.3213 23.3310 19.1503 24.3435 23.7069 19.5349 21.2032 18.4367 15.3930 24.9590
Muestra aleatoria Y: una fila con 15 cols. Y ~ N(20, 3) >> y=normrnd(20,3,1,15) y= 18.4441 20.9821 20.7022 20.0644 16.9882 17.1586 18.8767 16.4423 16.8323 24.4174 20.1672 16.3480 19.8763 16.6150 15.9522

>> [h, p, ci, stats]=ttest2(x, y, 0.05, 1) h=1 p = 0.0193 ci = 0.5211 Inf stats = tstat: 2.1943 df: 23

Prueba Ho: X = Y vs. Ha: X > Y, 2 2 X = Y , = 0.05. Prueba unilateral derecha

h =1 La evidencia es suficiente para rechazar Ho Valor p de la prueba Intervalo de confianza con nivel 1 Valor del estadstico de prueba T grados de libertad

245

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.7 INFERENCIAS PARA LA DIFERENCIA ENTRE DOS PROPORCIONES


CASO: Muestras grandes
Esta inferencia se utiliza para relacionar las proporciones de dos poblaciones. Sean dos poblaciones con distribucin binomial de las cuales se toman muestras aleatorias independientes para usar su diferencia como una estimacin de la diferencia entre las proporciones poblacionales. Parmetro: p1 - p2 Diferencia entre proporciones poblacionales Poblaciones con distribucin binomial y parmetros p1, p2 desconocidos Muestras aleatorias independientes de tamaos n1 y n2 mayores o iguales a 30 Estimador: p1 - p2 Diferencia entre proporciones muestrales en donde p 1=x1 /n1, p 2 =x2 /n2 Media y varianza del estimador p p = E( p 1 - p 2) = E( p 1) E( p 2) = E(x1/n1) E(x2/n2) =
1 2

= 1/n1E(x1) - 1/n2E(x2) = (1/n1)n1p1 - (1/n2)n2p2 = p1 - p2 (estimador insesgado)


2 = V( p 1 - p 2) = V[(1) p 1 + (-1) p 2] = (1)2V( p 1) + (-1)2V( p 2) p p
1 2

= V(x1/n1) + V(x2/n2) = =
1
2 n1

1
2 n1

V(x1) +

1 n2 2

V(x2)

(n1p1q1) +

1 n2 2

(n2p2q2) =

p1q1 p2 q2 + n1 n2

Estadstico de Prueba (p1 p2 ) p p (p p2 ) (p1 p2 ) 1 2 Z= = 1 p p p1q1 p2 q2 1 2 + n1 n2 Por el Teorema del Lmite Central tiene distribucin normal estndar aproximadamente. Con un criterio similar al usado anteriormente para muestras grandes, se puede aproximar la varianza poblacional mediante la varianza muestral.

p1q1 p2 q2 p1q1 p2 q2 + + n1 n2 n1 n2

246

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.7.1 INTERVALO DE CONFIANZA


Con un planteamiento similar al realizado en casos anteriores para muestras grandes:
(p1 p2 ) (p1 p2 ) p1q1 p2 q2 + n1 n2

Z=

Con probabilidad 1 - , se cumple la desigualdad: -z/2 Z z/2 Sustituyendo Z y despejando el parmetro de inters p1 - p2 se obtiene:

Definicin: Intervalo de confianza para p1 - p2 con nivel 1 -

(p1 p2 ) z /2

p1q1 p2 q2 p q p q + p1 - p2 (p1 p2 ) + z /2 1 1 + 2 2 n1 n2 n1 n2

Ejemplo 132 de 200 electores de la regin uno favorecen a un candidato, mientras que le son favorables 90 de 150 electores de la regin dos. Suponiendo que las muestras son aleatorias e independientes encuentre un intervalo de confianza de 99% para la diferencia entre las proporciones de electores que le son favorables en estas dos regiones. Solucin 1 - = 0.99 z/2 = z0.005 = 2.575
Sustituimos en la frmula anterior: p 1= x1/n1 = 132/200 = 0.66, p 2= x2/n2 = 90/150 = 0.6
(0.66 0.6) 2.575 (0.66)(0.34) (0.6)(0.4) + p1 - p2 200 150 (0.66 0.6) + 2.575 (0.66)(0.34) (0.6)(0.4) + 200 150

-0.074 p1 - p2 0.194 Con una confianza de 99%, se puede afirmar que la proporcin de votantes que favorecen al candidato va de 7.74% con una proporcin mayor en la regin 2, hasta un valor de 19.4% en la que la proporcin es mayor en la regin 1.

10.7.2 PRUEBA DE HIPTESIS


1) Formular la hiptesis nula: Ho: p1 - p2 = d0 (Algn valor especificado. Ej. d0=0)

2) Formular una hiptesis alterna. Elegir una entre: Ha: p1 - p2 < d0 Ha: p1 - p2 > d0 Ha: p1 - p2 d0

247

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

3) Especificar el nivel de significancia para la prueba 4) Seleccionar el estadstico de prueba y definir la regin de rechazo de Ho

Z=

(p1 p2 ) d0 p1q1 p2 q2 + n1 n2

, con distribucin normal estndar aproximadamente

Adicionalmente: Ha p1 - p2 < d0 p1 - p2 > d0 p1 - p2 d0

p1q1 p2 q2 p1q1 p2 q2 + + n1 n2 n1 n2
Regin de rechazo de Ho en favor de Ha z < -z z > z z < -z/2 z > z/2

5) Con los datos de la muestra calcular el valor del estadstico 6) Si el valor del estadstico de prueba cae en la regin de rechazo, la decisin es rechazar Ho en favor de Ha. Caso contrario, se dice que no hay evidencia suficiente para rechazar Ho.

EJERCICIOS
Un fabricante modific el proceso de produccin de sus artculos para reducir la proporcin de artculos defectuosos. Para determinar si la modificacin fue efectiva el fabricante tom una muestra aleatoria de 200 artculos antes de la modificacin y otra muestra aleatoria independiente, de 300 artculos despus de la modificacin, obteniendo respectivamente 108 y 96 artculos defectuosos.

a) Encuentre un intervalo de confianza de 98% para la diferencia entre las proporciones de artculos defectuosos en ambas poblaciones (antes y despus de la modificacin) b) Realice una prueba de hiptesis de 1% de significancia para probar que la modificacin realizada en el proceso de produccin reduce la proporcin de artculos defectuosos.

248

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.8 INFERENCIAS PARA DOS VARIANZAS


Parmetros:
2 2 1 , 2

(varianzas poblacionales)

Poblaciones con distribucin normal 2 S1 Estimadores: y S2 (varianzas muestrales) 2 muestras aleatorias independientes de tamao n1 y n2 2 S2 / 1 Estadstico de prueba: F = 1 2 S2 2 / 2 tiene distribucin F, con 1 = n1 1, 2 = n2 1 grados de libertad

10.8.1 INTERVALO DE CONFIANZA Se especifica un valor de probabilidad 1- en la distribucin F como se muestra en el grfico

Se tiene

F1 / 2, 1 , 2 F F / 2, 1 , 2

con probabilidad 1-

Si se sustituye F y se despeja el parmetro de inters se obtiene


2 2 2 S1 1 S1 1 1 2 2 2 S2 F / 2, 1 , 2 2 S2 F 1 / 2, 1 , 2

Con la definicin F1 , 1 , 2 =

1 F , 2 , 1
se puede escribir:

Definicin: Intervalo de confianza para

2 1 / 2 2 con nivel 1-

2 2 2 S1 1 S1 1 F / 2, 2 , 1 S2 2 S2 2 F / 2, 1 , 2 2 2

Con 1 = n1 1, 2 = n2 1 grados de libertad

249

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo De dos poblaciones con distribuciones normales se han tomado dos muestras aleatorias independientes y se obtuvieron: X Muestra n S2 1 10 5.9 4 2 8 7.1 5 Encuentre un intervalo para
2 1 / 2 2 con un nivel de confianza de 90%

Solucin 1- = 0.9 /2 = 0.05, 1 = 10 1 = 9, 2 = 8 1 = 7

F / 2,1 , 2 = F0.05, 9, 7 = 3.68

(Tabla F)

F / 2,2 ,1 = F0.05, 7, 9 = 3.29


Sustituyendo 2 2 1 4 1 4 1 3.29 0 .2222 2.6320 5 3.68 5 2 2 2 2

10.8.2 PRUEBA DE HIPTESIS


1) 2) Definir la hiptesis nula Elegir una Hiptesis alterna: Ho: 1 = 2
2 2

Ha: 1 < 2
2 2 2 2

Ha: 1 > 2
2

Ha: 1 2
2

3) 4)

Seleccionar el nivel de significancia Estadstico de prueba. Se obtiene simplificando 1 = 2


2 2

, distribucin F con 1 = n1 1, 2 = n2 1 grados de libertad S2 2 Regin crtica Ha Regin de rechazo de Ho en favor de Ha F=


2 1 < 2 2 2 1 > 2 2 2 1 2 2

2 S1

F < F1 F > F F < F1-/2 F > F/2

5) 6)

Calcular el valor del estadstico de prueba con los datos de la muestra Decidir

Ejemplo De dos poblaciones con distribuciones normales se han tomado dos muestras aleatorias independientes y se obtuvieron: X Muestra n S2 1 10 5.9 4 2 8 7.1 5 Pruebe con 10% de significancia que las poblaciones tienen varianzas diferentes

250

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Solucin 1) 2) 3) 4) Ho: 1 = 2
2 2

Ha: 1 2
2 2

= 0.1
Estadstico de prueba S2 F= 1 , distribucin F con 1 = n1 1, 2 = n2 1 grados de libertad S2 2 Regin crtica = 0.1 /2 = 0.05, 1 = 10 1 = 9, 2 = 8 1 = 7

F / 2, 1 , 2 = F0.05, 9, 7 = 3.68

(Tabla F)

F1 / 2, 1 , 2 = F0.95, 9, 7 =

1 F / 2, 1 , 2

1 F0.05, 7, 9

1 = 0.304 3.29

Regin de rechazo de Ho en favor de Ha F < 0.304 F > 3.68

5)

6)

Clculo del estadstico de prueba S2 = 4/5 = 0.8 F= 1 S2 2 Decisin: No hay evidencia suficiente en la muestra para rechazar la hiptesis que las varianzas poblacionales son iguales

EJERCICIOS
Las siguientes son las calificaciones obtenidas en el examen final de una materia por dos grupos de 8 mujeres y 8 hombres: Hombres Mujeres 55 73 68 65 70 74 66 80 91 76 78 63 81 82

Suponiendo que los datos pueden considerarse como muestras aleatorias independientes tomadas de poblaciones con distribucin normal, pruebe con 5% de significancia que la varianza de las calificaciones de los hombres es mayor a la de las mujeres.

251

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.9 PRUEBA PARA LA DIFERENCIA DE MEDIAS CON MUESTRAS PAREADAS


Esta prueba permite comparar las medias de dos poblaciones usando dos muestras aleatorias que no son independientes. Esto significa que las observaciones de una muestra influyen en los resultados de la otra. Suponga que se quiere conocer la opinin acerca de la calidad de dos marcas de cierto producto. Si se eligiera una muestra aleatoria del producto de la una marca y se la probara con un grupo de personas, y se eligiera una muestra aleatoria del producto de la otra marca y se las probara con otro grupo de personas, entonces las muestras seran independientes. Pero, si se las muestras aleatorias de las dos marcas del producto se las probase con el mismo grupo de personas, entonces los resultados obtenidos ya no son independientes pues la opinin de cada persona respecto a la una marca, afecta a su opinin acerca de la otra marca. Este es un caso de muestras pareadas. Supongamos dos poblaciones acerca de las cuales es de de inters estimar el valor de la diferencia entre estas medias poblacionales. De estas poblaciones se toman muestras aleatorias pareadas. Al no ser muestras independientes, no se puede usar como estimador la diferencia de las medias muestrales, siendo necesario definir otro estadstico. Parmetro: 1 - 2 n: Tamao de la muestra pareada X1: Observaciones obtenidas en la muestra tomada de la poblacin 1 X2: Observaciones obtenidas en la muestra tomada de la poblacin 2 Di = X1,i X2,i , i=1, 2, ..., n: Diferencias entre observaciones Di son variables aleatorias independientes. Estimador D : media de las diferencias entre las observaciones 1 n 1 n 2 SD D = Di = con varianza (Di D)2 n i=1 n 1 i =1

D es un estimador insesgado del parmetro: D = E[Di] = E[X1,i X2,i ] = E[X1,i] E[X2,i ] = 1 2

10.9.1 PRUEBA DE HIPTESIS


1) 2) Ho: Ha: o o

1 - 2 = d0 1 - 2 < d0 1 - 2 > d0 1 - 2 d0

(algn valor especificado, por ejemplo 0)

3) 4)

nivel de significancia

Estadstico de prueba

252

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Caso: n 30 D d0 Z= SD
n Con distribucin aproximadamente normal estndar por el Teorema del Lmite Central

Caso: n < 30. Suponer poblaciones con distribucin normal aproximadamente D d0 T= SD


n

Con distribucin T con = n 1 grados de libertad

Ejemplo Los siguientes datos corresponden a un estudio de las horas perdidas mensualmente por accidentes de trabajo en 6 fbricas antes y despus de implantar un programa de seguridad industrial. Fbrica 1 2 3 4 5 6 Antes (horas perdidas) 45 73 46 39 17 30 Despus (horas perdidas) 36 60 44 29 11 32

Suponiendo que la poblacin es normal, probar con 5% de significancia que el programa es eficaz. Solucin Sean 1 media de las horas perdidas antes del programa 2 media de las horas perdidas despus del programa
Se desea probar que 1 > 2 1 2 > 0 1) 2) 3) 4) Ho: 1 2 = 0 Ha: 1 2 > 0 = 0.05 Estadstico de prueba, n < 30 D d0 T= SD
n

Distribucin T con = n 1 grados de libertad

t = t0.05 = 2.015, con = n 1 = 5 grados de libertad


Regin de rechazo para Ho: t > 2.015

253

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

5)

d=

1 n 1 di = 6 [(45-36) + (73-60) + ... ] = 6.335 n i =1

s2 =
D

1 n 1 (di d)2 = 5 [(9-5.5)2 + (13-5.5)2 + ... ] =30.6666 n 1 i=1


30.6666 = 5.5377

sD = t=

6)

6.335 0 = 2.8022 > 2.015 5.5377 6 Decisin: Se rechaza Ho en favor de Ha, es decir, con una significancia de 5% se puede afirmar que el programa si es eficaz

EJERCICIOS
1) Los siguientes datos corresponden a la frecuencia cardiaca de un grupo de 6 personas medida antes y despus de haberse sometido a un tratamiento: Antes: 83, 78, 91, 87, 85, 84 Despus: 76, 81, 88, 86, 83, 87
Pruebe con 5% de significancia que este tratamiento no varia la frecuencia cardiaca de las personas que lo toman. Suponga que la poblacin es normal

2) Se eligieron 6 trabajadores para realizar una tarea, antes y despus de aplicar una nueva tcnica, obtenindose los siguientes resultados en horas: 8 y 6, 10 y 7, 8 y 8, 10 y 8, 8 y 7, 9 y 7
Con un nivel de significancia de 5% pruebe si la nueva tcnica es eficaz

MATLAB
Prueba de hiptesis relacionada con muestras pareadas, n < 30 >> antes = [45 73 46 39 17 30]; >> despues = [36 60 44 29 11 32]; >> d=antes - despues d= 9 13 2 10 6 -2 >> [h, p, ci, t] = ttest(d, 0, 0.05, 1) h= 1 p= 0.0190 ci = 1.7778 Inf t= tstat: 2.8014 df: 5
Datos antes Datos despus Vector de diferencias Ho: 1 2 = 0 vs. Ho: 1 2 > 0 = 0.1. Prueba unilateral derecha

Prueba

h=0 La evidencia no es suficiente para rechazar Ho Valor p de la prueba Intervalo de confianza para d Valor del estadstico de prueba Grados de libertad

254

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.10 TABLAS DE CONTINGENCIA


Esta prueba se puede usar para determinar la independencia entre dos mtodos o factores involucrados en la obtencin de datos. Para aplicar esta prueba se organiza una tabla, colocando en las filas y columnas los resultados obtenidos con ambos factores. Terminologa n: Cantidad de observaciones en la muestra r: Cantidad de filas c: Cantidad de columnas ri: Total de resultados en la fila i cj: Total de resultados en la columna j ni, j: Total de resultados observados en la fila i, columna j ei, j: Total de resultados esperados en la fila i, columna j Obtencin de la frecuencia esperada ei, j Definiciones pi: Probabilidad que un resultado pertenezca a la fila i

(son los datos muestrales) (se obtiene con la hiptesis)

pi = ri / n pj: Probabilidad que un resultado pertenezca a la columna j pj = cj / n pi, j: Probabilidad que un resultado pertenezca a la fila i, columna j
Hiptesis que se debe probar Que los resultados son independientes de entre filas y columnas Ho: pi, j = pi pj Si esta hiptesis fuese cierta se tendra que la frecuencia esperada sera

ri c j r cj ei, j = pi, j n = pi pj n = ( i )( )n = n n n
Definicin: Estadstico de prueba para tablas de contingencia =
2

i =1 j= 1

(ni, j e i, j ) 2 e i, j

, tiene distribucin Ji-cuadrado con =(r1)(c1) grados de libertad

Dado el nivel de significancia para la prueba, si las diferencias entre la frecuencia observada ni, j y la frecuencia esperada e i, j son significativas, entonces el estadstico de prueba caer en la regin de rechazo de la hiptesis nula Ho la cual propone independencia entre resultados.

=
2

i = 1 j= 1

(ni, j e i, j ) 2 e i, j

Si >
2

Regin de rechazo de Ho se rechaza Ho Los resultados no son independientes entre filas y columnas

255

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.10.1 PRUEBA DE HIPTESIS


1) 2) 3) 4) 5) Ho: Ha:

i,j ( pi,j = pi pj )
Ho

(los resultados son independientes entre filas y columnas) (los resultados no son independientes)

: nivel de significancia de la prueba


Con los valores de y = (r 1)(c 1) se define la regin de rechazo de Ho 2 >
2

Calcular el valor del estadstico de prueba =


2

i =1 j= 1

(ni, j e i, j ) 2 e i, j

, distribucin Ji-cuadrado con =(r-1)(c-1) grados de libertad

Ejemplo Los siguientes datos corresponden a la cantidad de errores de produccin de artculos en una empresa, organizados por tipo de error (columnas 1, 2, 3, 4) y por el equipo de obreros que los fabric (filas 1, 2, 3)

1 1 2 3
15 26 33

2
21 31 17

3
45 34 49

4
13 5 20

Pruebe con 5% de significancia que la cantidad de errores en la produccin de los artculos es independiente del tipo de error y del equipo que los fabric

Solucin Completamos el cuadro colocando en los bordes las sumas de filas y columnas y en la parte inferior de cada celda la frecuencia esperada calculada con la frmula:

n e1,1 = r1 c1 / n = (94)(74)/309 = 22.51 e1,2 = r1 c2 / n = (94)(69)/309 = 20.99 e1,3 = r1 c3 / n = (94)(128)/309 = 38.94 e1,4 = r1 c4 / n = (94)(38)/309 = 11.56 e2,1 = r2 c1 / n = (96)(74)/309 = 22.99 ... etc
Tabulacin

ei,j =

ri c j

1 1 2 3
15 22.51 26 22.99 33 28.50

2
21 20.99 31 21.44 17 26.57 69

3
45 38.94 34 39.77 49 49.29 128

4
13 11.56 5 11.81 20 14.63 38

ri
94 96 119 n = 309

cj 74

256

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Definimos la regin de rechazo 2 = 0.05 , = (r 1)(c 1) = (3)(2) = 6 2 = 0.05 = 12.54 Rechazar Ho si 2 > 12.54 Clculo del estadstico de prueba =
2

(Tabla 2)

i =1 j= 1

(ni, j e i, j ) 2 e i, j

(15 22.51)2 (21 20.99)2 (45 38.94)2 + + + ... =19.18 22.51 20.99 38.94

Decisin El valor del estadstico de prueba cae en la regin de rechazo de Ho, por lo tanto se concluye que no hay independencia entre el tipo de error en los artculos producidos y el equipo de obreros que los fabric.

EJERCICIOS
1) Los siguientes datos corresponden a las calificaciones en tres materias (columnas 1, 2, 3) obtenidas por cuatro estudiantes (filas 1, 2, 3, 4)

1 1 2 3 4
73 65 70 68

2
68 70 73 71

3
56 50 55 54

Pruebe con 5% de significancia que no hay dependencia entre las calificaciones obtenidas en las materias y los estudiantes 2) En una muestra aleatoria de 100 ciudadanos de Guayaquil, se los clasific por su ocupacin: obrero, estudiante, profesional, y se les consult si estn a favor o en contra de la integracin de un organismo de justicia, propuesto por el Congreso. Se obtuvieron los siguientes datos: Obrero 10 12 Estudiante 16 26 Profesional 14 22

A favor En contra

Proponga y pruebe una hiptesis para demostrar, con 5% de significancia, que la opinin de los ciudadanos es independiente de su ocupacin.

257

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Prueba con tablas de contingencia >> n=[15 21 45 13; 26 31 34 5; 33 17 49 20] n= 15 21 45 13 26 31 34 5 33 17 49 20 >> r=sum(t) r= 74 69 128 >> c=sum(t' ) c= 94 96 119 >> e=(c' *(r))/(sum(sum(t))) e= 22.5113 20.9903 38.9385 11.5599 22.9903 21.4369 39.7670 11.8058 28.4984 26.5728 49.2945 14.6343 >> ji2=sum(sum((n-e).^2./e)) ji2 = 19.1780 >> vc=chi2inv(0.95,6) vc = 12.5916 Frecuencias observadas

Suma de filas 38 Suma de columnas

Frecuencias esperadas

Valor del estadstico de prueba

Valor crtico de rechazo

Conclusin: El valor del estadstico cae en la regin de rechazo de Ho

258

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.11 PRUEBAS DE BONDAD DE AJUSTE


Estas pruebas permiten verificar que la poblacin de la cual proviene una muestra tiene una distribucin especificada o supuesta. Sean X: variable aleatoria poblacional f0(x) la distribucin (o densidad) de probabilidad especificada o supuesta para X Ho: Ha:

Se desea probar la hiptesis: En contraste con la hiptesis alterna:

f(x) = f0(x)
H0 (negacin de Ho)

10.11.1 PRUEBA JI-CUADRADO


Esta prueba es aplicable para variables aleatorias discretas o continuas Sea una muestra aleatoria de tamao n tomada de una poblacin con una distribucin especificada f0(x) que es de inters verificar. Suponer que las observaciones de la muestra estn agrupadas en k clases, siendo ni la cantidad de observaciones en cada clase i = 1, 2, ..., k Con el modelo especificado f0(x) se puede calcular la probabilidad pi que un dato cualquiera pertenezca a una clase i. Con este valor de probabilidad se puede encontrar la frecuencia esperada ei para la clase i, es decir, la cantidad de datos que segn el modelo propuesto deberan estar incluidos en la clase i:

ei = pi n,

i = 1, 2, ..., k

Tenemos entonces dos valores de frecuencia para cada clase i ni: frecuencia observada (corresponde a los datos de la muestra) ei: frecuencia esperada (corresponde al modelo propuesto) La teora estadstica demuestra que la siguiente variable es apropiada para realizar una prueba de bondad de ajuste: Definicin: Estadstico para la prueba de bondad de ajuste Ji-cuadrado

(ni e i ) 2 = , distribucin Ji-cuadrado con = k1 grados de libertad ei i=1 Es una condicin necesaria para aplicar esta prueba que i(ei5)
2

2 Dado un nivel de significancia se define un valor crtico para el rechazo de la hiptesis propuesta Ho: f(x) = f0(x).

Si las frecuencias observadas no difieren significativamente de las frecuencias esperadas calculadas con el modelo propuesto, entonces el valor de estadstico de prueba 2 ser cercano a cero. Pero si estas diferencias son significativas, entonces el valor del estadstico 2 estar en la regin de rechazo de Ho: 2 > 2

259

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

2 =

i = 1 j= 1

(ni, j e i, j ) 2 e i, j

Regin de rechazo de Ho Ejemplo Se ha tomado una muestra aleatoria de 40 bateras y se ha registrado su duracin en aos. Estos resultados se los ha agrupado en 7 clases, como se muestra en el siguiente cuadro i clase (duracin) frecuencia observada (ni) 1 1.45 1.95 2 2 1.95 2.45 1 3 2.45 2.95 4 4 2.95 3.45 15 5 3.45 3.95 10 6 3.95 4.45 5 7 4.45 4.95 3 Verificar con 5% de significancia que la duracin en aos de las bateras producidas por este fabricante tiene duracin distribuida normalmente con media 3.5 y desviacin estndar 0.7 Nota: En general, si no se especifican los parmetros del modelo propuesto, deben estimarse a partir de los datos de la muestra Solucin Sea X: duracin en aos (variable aleatoria contnua) 1) 2) 3) Ho: f(x) = N(3.5, 0.7) Ha: H0 = 0.05 (distribucin normal, =3.5, =0.7)

Clculo de la probabilidad correspondiente a cada intervalo p1 = P(X1.95) = P(Z(1.95 3.5)/0.7) = 0.0136 p2 = P(1.95X2.45) = P((1.95 3.5)/0.7 Z (2.45 3.5)/0.7) = 0.0532 p3 = P(2.45X2.95) = P((2.45 3.5)/0.7 Z (2.95 3.5)/0.7) = 0.135 ... (etc) Clculo de las frecuencias esperadas e1 = p1 n = 0.0136 (40) 0.5 e2 = p2 n = 0.0532 (40) 2.1 e3 = p3 n = 0.135 (40) 5.4 ... (etc)

260

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Resumen de resultados Duracin (aos) 1.45 1.95 1.95 2.45 2.45 2.95 2.95 3.45 3.45 3.95 3.95 4.45 4.45 4.95

frecuencia observada (ni) frecuencia esperada (ei) 2 0.5 1 2.1 4 5.4 15 10.3 10 10.7 5 7 3 3.5

Es necesario que se cumpla la condicin i(ei5) por lo que se deben agrupar clases adyacentes. Como resultado se tienen cuatro clases: k=4 Duracin (aos) 1.45 2.95 2.95 3.45 3.45 3.95 3.95 4.95 frecuencia observada (ni) frecuencia esperada (ei) 7 8.5 15 10.3 10 10.7 8 10.5

Ahora se puede definir la regin de rechazo de Ho = 0.05, = k 1 = 3, 2 0.05 = 7.815 2 Rechazar Ho si > 7.815 5)
k

(Tabla 2)

Clculo del estadstico de prueba

2 =

(ni e i ) 2 (7 8.5)2 (15 10.3)2 (10 10.7)2 (8 10.5)2 = + + + = 3.05 8.5 10.3 10.7 10.5 e i i=1
Decisin Como 3.05 no es mayor a 7.815, se dice que no hay evidencia suficiente para rechazar el modelo propuesto para la poblacin.

6)

EJERCICIO
El siguiente cuadro muestra el registro del tiempo en horas que duran encendidos hasta que fallan una muestra de 200 focos de cierta marca Tiempo Cantidad en horas de focos 0 250 82 250 500 45 500 750 34 750 1000 15 1000 1250 10 1250 1500 6 1500 1750 4 1750 2000 3 2000 2250 1 Con 10% de significancia verifique la hiptesis que el tiempo de duracin de los focos tiene distribucin exponencial. Debido a que no se especifica el parmetro del modelo propuesto, debe estimarlo a partir de los datos de la muestra (calcule la media muestral con la frmula para datos agrupados)

261

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Colocar la densidad normal sobre el histograma de la muestra Datos de la muestra >> x = [ 5.73 5.01 6.89 8.28 5.43 5.01 5.85 7.12 5.00 4.51 6.03 6.10 6.87 ... 5.36 5.99 5.59 6.08 8.34 5.35 4.31 6.85 4.93 6.25 5.32 6.94 6.97 ... 5.91 3.32 6.38 8.43 7.62 3.98 6.08 5.24 4.76 4.47 6.60 5.59 6.27 5.68]; Tabulacin de frecuencia en siete clases >> f = hist(x,7) f= 2 4

11

Graficar el histograma y la distribucin normal >> histfit(x, 7)

262

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.11.2

PRUEBA DE KOLMOGOROV - SMIRNOV (K-S)

Esta prueba se usa para probar modelos de probabilidad con variables aleatorias continuas. Es de especial inters para muestras pequeas en las cuales por no estar los datos agrupados no es factible aplicar la prueba de bondad de ajuste ji-cuadrado. Sea X: variable aleatoria continua f0(x) funcin de densidad de probabilidad especificada o supuesta para X Ho: Ha: f(x) = f0(x) H0 (Negacin de Ho)

Se desea probar la hiptesis: En contraste con la hiptesis alterna:

Sea una muestra aleatoria de tamao n tomada de una poblacin con una distribucin especificada f0(x) que es de inters verificar:

x1, x2, ... ,xn


Las observaciones se las ordenadas en forma creciente:

x(1), x(2), ... ,x(n)


Con los valores de x se obtienen valores de la siguiente funcin Sn(x) Definicin: Funcin de distribucin acumulada emprica

0, Sn (x ) = i / n, 1,

x < x (1) x (i) x < x (i + 1) x x (n)

Sea F0(x) la funcin de distribucin acumulada correspondiente al modelo propuesto f0(x) F0(x) = P(X x) Con los valores de x se obtienen valores de la funcin F0(x). Se tabulan los valores calculados de Sn(x) y F0(x). Entonces se utiliza el estadstico para esta prueba definido de la siguiente forma: Definicin: Estadstico de prueba K-S (Kolmogorov-Smirnov) Dn = max |Sn(xi) F0(xi)| , i=1, 2, ..., n Si se especifica el nivel de significancia se puede construir la regin de rechazo para la prueba Regin de rechazo de Ho Sea: D valor crtico tomado de la tabla para la prueba K-S Rechazar Ho si Dn > D Algunos valores del estadstico D estn tabulados en la tabla K-S

263

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Ejemplo Suponga los siguientes datos obtenidos en una muestra aleatoria: 7.2, 7.5, 8.1 9.6, 9.1, 8.1, 7.6, 6.8 Pruebe con 5% de significancia que provienen de una poblacin con distribucin normal, con media 8 y varianza 1: X N(8, 12) Solucin Ho: f(x) = N(8, 12) Ha: H0 = 0.05 (Hiptesis que interesa probar)

Regin de rechazo de Ho = 0.05, n = 8 D0.05 = 0.457 Rechazar Ho si Dn > 0.457 Se colocan en un cuadro los datos ordenados de la muestra Se escriben los valores de la distribucin emprica:

(Tabla K-S)

x(i)
Sn(x)

Se calculan los valores de F0(x) segn el modelo propuesto x 8 ) (Distribucin normal estndar acumulada) F0(xi) = P(Xxi) = P(Z i 1 Se usan los valores de Xi en el orden escrito en la tabla 6.8 8 ) = F(-1.2) = 0.1151 F0(6,8) = P(X6.8) = P(Z 1 7.2 8 F0(7.2) = P(X7.2) = P(Z ) = F(-0.8) = 0.2119 1 etc. Se escriben los resultados en la tabla y se calcula Dn

(Tabla Z)

i
1 2 3 4 5 6 7 8

xi (ordenados)
6.8 7.2 7.5 7.6 8.1 8.1 9.1 9.6

Sn(xi)
1/8 2/8 3/8 4/8 5/8 6/8 7/8 1

F0(xi)
0.1151 0.2119 0.3085 0.3446 0.5398 0.5398 0.8643 0.9452

|Sn(xi)- F0(xi)|
0.0099 0.0381 0.0665 0.1554 0.0852 0.2102 0.0107 0.0548

Valor del estadstico de prueba Dn = max |Sn(xi) F0(xi)| , i=1, 2, ..., n Dn = 0.2102 Decisin Dn no cae en la regin de rechazo, por lo tanto los datos de la muestra no proporcionan evidencia suficiente para rechazar el modelo propuesto para la poblacin

264

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
1) El fabricante de un artculo afirma que la resistencia media de su producto tiene distribucin normal con media 4.5 y con desviacin estndar de 0.7. Una muestra aleatoria 6 observaciones produjo los siguientes resultados: 5.2 4.3 3.7 3.9 5.4 4.9 Realice la prueba de bondad de ajuste K-S, con 5% de significancia para determinar si los datos obtenidos en la muestra provienen de la poblacin especificada. 2) La siguiente es una muestra del tiempo en horas que funciona un dispositivo electrnico de control hasta que se presenta una falla y recibe mantenimiento: 199.4 73.2 40.5 39.2 36.0 24.9 13.5 9.8 5.7 2.5

Realice la prueba de bondad de ajuste K-S, con 5% de significancia para determinar si los datos obtenidos en la muestra provienen de una poblacin con distribucin exponencial.

265

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Prueba de bondad de ajuste K - S
>> x=[7.2 7.5 8.1 9.6 9.1 8.1 7.6 6.8]; >> cdfplot(x) >> z=5: 0.1: 10; >> f=normcdf(z, 8, 1); >> hold on, plot(z, f, 'k') Vector con los datos de una muestra Grfico de la distribucin emprica acumulada Puntos para la distribucin normal acumulada Valores de la distribucin normal acumulada con el modelo propuesto Ho: X N(8, 12) Superponer el grfico del modelo propuesto

>> x = sort(x) x= 6.8000 7.2000 >> sn = 1/8: 1/8: 1 sn = 0.1250 0.2500 >> f = normcdf(x,8,1) f= 0.1151 0.2119 >> dn = max(sn - f) dn = 0.2102

Ordenamiento de los datos de la muestra 7.5000 7.6000 8.1000 8.1000 9.1000 9.6000 Distribucin acumulada emprica 0.5000 0.6250 0.7500 0.8750 1.0000 Distribucin acumulada normal Ho: X N(8, 12) 0.3446 0.5398 0.5398 0.8643 0.9452 Valor del estadstico Dn: la mayor diferencia

0.3750

0.3085

Prueba de bondad de ajuste usando directamente una funcin especializada de MATLAB >> x=[7.2 7.5 8.1 9.6 9.1 8.1 7.6 6.8]; >> x=sort(x); >> f=normcdf(x,8,1); Vector con datos de la muestra Datos ordenados Valores con el modelo propuesto: Ho: X N(8, 12) Prueba de bondad de ajusta K-S x f son dos columnas con el modelo h=0: No se rechaza el modelo Valor p de la prueba Valor del estadstico de prueba Valor crtico para la regin de rechazo

>> [h,p,ksstat,vc]=kstest(x,[x' f' ], 0.05,0) h=0 p = 0.8254 ksstat = 0.2102 vc = 0.4543

266

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.12 ANLISIS DE VARIANZA


Esta prueba se utiliza para determinar si las medias muestrales provienen de poblaciones con medias iguales, cuando hay ms de dos poblaciones en estudio. El anlisis de varianza (ANOVA) permite comparar simultneamente todas las medias, evitando tener que realizar pruebas en grupos de dos con las tcnicas vistas anteriormente. La comparacin de las medias muestrales se basa en las varianzas muestrales Suposiciones necesarias para el anlisis de varianza 1) Las poblaciones tienen distribucin normal 2) Las poblaciones tienen varianzas iguales 3) Las muestras son independientes Definiciones: Tratamiento: Es la fuente de datos cuya variacin proporciona las observaciones. Sean. k: n: nj: Nmero de tratamientos Nmero total de observaciones en todos los tratamientos combinados Nmero total de observaciones en cada tratamiento j = 1, 2, ..., k Es la i-esima observacin del tratamiento j Media muestral del tratamiento j (incluye las observaciones de cada tratamiento) Media muestral general (incluye a todas las observaciones de todos los tratamientos)

xi,j:
Xj :
X:

Variacin Total: Es la variacin total combinada de las observaciones de todos los tratamientos con respecto a la media general Media muestral general:

1 k j X = Xi,j n j= 1 i = 1
SCT =

Variacin total:

(Xi,j X)2
j= 1 i = 1
nj

nj

(Suma cuadrtica total)

Variacin de tratamientos: Es la variacin atribuida a los efectos de los tratamientos


Media muestral del tratamiento j: X j = Variacin de tratamientos: SCTr =
k

1 nj

Xi,j
i=1

n j (X j X)2
j= 1

(Suma cuadrtica de tratamientos)

Variacin aleatoria o error: Es la variacin dentro de cada tratamiento debido a errores en el experimento. Variacin aleatoria o error: SCE = SCT SCTr (Suma cuadrtica del error)
La ecuacin SCT = SCTr + SCE separa la variacin total en dos componentes: el primero corresponde a la variacin atribuida a los tratamientos y el segundo es la variacin atribuida a la aleatoriedad o errores del experimento

SCTr tiene k 1 grados de libertad (varianza ponderada con k tratamientos) SCE tiene n k grados de libertad (existen n datos y k tratamientos) SCT tiene n 1 grados de libertad (suma de grados de libertad de SCTr y SCE)
Si cada uno se divide por el nmero de grados de libertad se obtienen los cuadrados medios

Todos estos resultados se los ordena en un cuadro denominado tabla de anlisis de varianza

267

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

10.12.1
Fuente de variacin Tratamiento Error Total

TABLA ANOVA (ANLISIS DE VARIANZA)


Grados de libertad k1 nk n1 Suma de cuadrados SCTr SCE SCT Cuadrados medios SCTr/(k 1) SCE/( n k)

F0 (SCTr/(k 1))/(SCE/( nk))

El ltimo cociente es el valor de una variable que tiene distribucin F. Este estadstico se usa para la prueba de hiptesis

10.12.2
1) 2) 3) 4) 5) 6)

PRUEBA DE HIPTESIS

Hipotesis nula Ho: 1 = 2 = . . . = k (las medias poblacionales son iguales) Hiptesis alterna: Ha: Ho (al menos dos medias son iguales) Definir el nivel de significancia de la prueba Elegir el estadstico de prueba: Distribucin F con 1 = k 1, 2 = n k g. l. Definir la regin de rechazo de Ho Calcular Fo Decidir

Ejemplo Para comparar las calificaciones promedio que obtienen los estudiantes en cierta materia que la imparten cuatro profesores, se eligieron 32 estudiantes que deben tomar esta materia y se los distribuy aleatoriamente en los cuatro paralelos asignados a los cuatro profesores.
Al finalizar el semestre los 32 estudiantes obtuvieron las siguientes calificaciones

Profesor A 68 90 67 85 86 53 64 71

Profesor B 80 73 68 67 49 67 63 60

Profesor C 87 82 92 72 45 74 85 93

Profesor D 56 80 71 91 80 56 67 53

Con una significancia de 5% determine si existe evidencia de que hay diferencia en las calificaciones promedio entre los cuatro paralelos.

1) 2) 3) 4)

Hipotesis nula Ho: 1 = 2 = 3 = 4 (Las 4 medias de las notas son iguales) Hiptesis alterna: Ha: Ho (Al menos en dos paralelos son diferentes) Nivel de significancia = 0.05 Estadstico de prueba F con 1 = 4 1 = 3, 2 = 32 4 = 28 g. l. Regin de rechazo

F ,1 , 2 = F0.05, 3, 28 = 2.95
Rechazar Ho si Fo > 2.95

(tabla F)

5)

Calcular Fo

X=

1 k j 1 4 j 1 Xi,j = Xi,j = 32 (68 + 90 + ... + 67 + 53) = 71.7188 n j=1 i =1 32 j=1 i=1

SCT =

(Xi,j X)2 = (68 71.7188)2 + (90 71.7188)2 + ... = 5494.5


j= 1 i = 1

nj

268

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

X1 =
X2 =

1 1 1 Xi,1 = (68 + 90 + ... + 64 + 71) = 73 n1 i=1 8


1 n2

Xi,2 = 8 (80 + 73 + ... + 63 + 60) = 65.875 Xi,3 = 8 (87 + 82 + ... + 85 + 93) = 78.75
i =1 n4 i =1 n3

n2

1 X3 = n3 X4 = 1 n4

Xi,4 = 8 (56 + 80 + ... + 67 + 53) = 69.25


i=1 k

SCTr =

n j (X j X)2 = 8(73 71.7188)2 + 8(65.875 71.7188)2 + ... = 730.6


j= 1

SCE = SCT SCTr = 5494.5 730.6 = 4763.9


730.6 SCTr 3 Fo = k 1 = = 1.4314 SCE 4763.9 nk 28

6)

Decisin: Fo no cae en la regin de rechazo. Por lo tanto no se puede rechazar la hiptesis de que las medias de las calificaciones de los cuatro paralelos son iguales

EJERCICIO
Para comparar la efectividad de cuatro tipos de fertilizantes para cierto tipo de producto, se dividi una zona de cultivo en veinte parcelas de igual tamao y se administraron cada uno de los fertilizantes en cinco parcelas elegidas aleatoriamente. Al finalizar el periodo de cultivo se registraron las cantidades del producto obtenidas en las parcelas asignadas a cada tipo de fertilizante con los siguientes resultados, en las unidades de medida que corresponda:

Fertilizante A 27 21 24 23 28

Fertilizante B 26 23 20 26 23

Fertilizante C 24 26 27 22 24

Fertilizante D 23 27 26 23 25

Con una significancia de 5% determine si existe evidencia de que hay diferencia en las cantidades promedio del producto que se obtuvieron con los cuatro tipos de fertilizante.

269

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Anlisis de varianza
Definicin de la matriz de datos. Cada columna es un tratamiento (compare con el ejemplo)

>> notas=[ 68 80 87 56; 90 73 82 80; 67 68 92 71;85 67 72 91; ... 86 49 45 80; 53 67 74 56; 64 63 85 67;71 60 93 53] notas = 68 80 87 56 90 73 82 80 67 68 92 71 85 67 72 91 86 49 45 80 53 67 74 56 64 63 85 67 71 60 93 53 >> [p, tabla, stats] =anova1(notas, {'A','B','C','D'}) Anlisis de varianza con rtulos p= Valor p de la prueba con F 0.2546 tabla = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' Tabla ANOVA 'Columns' [ 730.5938] [ 3] [243.5313] [1.4314] [0.2546] 'Error' [4.7639e+003] [28] [170.1384] [] [] 'Total' [5.4945e+003] [31] [] [] [] stats = means: [73 65.8750 78.7500 69.2500] Medias de los tratamientos df: 28 Grados de libertad s: 13.0437 Error estndar
Adicionalmente MATLAB muestra la tabla ANOVA en un formato estndar

MATLAB tambin proporciona los diagramas de caja de los tratamientos

270

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

11

REGRESIN LINEAL SIMPLE

El propsito de este estudio es proporcionar los conceptos y tcnicas para construir modelos matemticos que describan de manera apropiada a un conjunto de datos, cuando la relacin es de tipo lineal. Estos modelos son tiles para realizar pronsticos. Este estudio se denomina anlisis de regresin y el objetivo es estimar la ecuacin de regresin la cual es la recta terica poblacional (desconocida) de la cual provienen los datos. Suponer que se tiene un conjunto de n mediciones u observaciones (x1, y1), (x2, y2),...,(xn, yn) Estas observaciones provienen de las variables X y Y. La variable X se denomina variable de prediccin mientras que la variable Y se denomina variable de respuesta. Se supondr que existe una correspondencia de X a Y y el objetivo es modelar esta relacin. Cada valor yi es una observacin o el resultado de una medicin, por lo tanto pudiesen haber otros valores yi para el mismo valor de xi. Esto permite entender que yi es uno de los posibles resultados de la variable aleatoria Yi. Una variable aleatoria debe tener una distribucin de probabilidad. El siguiente grfico permite visualizar esta suposicin: Un resultado de la variable aleatoria Yi

Distribucin de probabilidad de la variable aleatoria Yi

Si la relacin entre X y Y tiene tendencia lineal, lo cual puede reconocerse graficando los puntos en una representacin que se denomina grfico de dispersin, entonces es razonable proponer un modelo lineal para describir la relacin y que tome en cuenta la aleatoriedad de Y Definicin: Modelo de regresin lineal probabilista (modelo poblacional desconocido)

Y = 0 + 1 x +
En donde 0 y 1 son los parmetros del modelo y es el componente aleatorio de Y Se supondr que para cada variable aleatoria Yi el componente aleatorio i tiene la misma distribucin de probabilidad y que adems estos componentes son variables independientes:

i N(0, 2) (distribucin normal con media 0 y varianza desconocida 2)


Con este planteamiento, el valor esperado de este modelo constituye la recta terica que describe al modelo poblacional desconocido.

E[Y] = 0 + 1 x
El modelo poblacional terico tiene dos parmetros 0 (intercepcin) y 1 (pendiente)

271

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Modelo Poblacional

0 + 1 x

Para comprensin de conceptos se desarrolla paralelamente un ejemplo

Ejemplo
Se desea construir un modelo de regresin para relacionar las calificaciones parcial y final en cierta materia, utilizando una muestra aleatoria de 10 estudiantes que han tomado esta materia: Estudiante Nota Parcial Nota Final 1 39 65 2 43 75 3 21 52 4 64 82 5 57 92 6 43 80 7 38 73 8 75 98 9 34 56 10 52 75

Diagrama de dispersin X: calificacin parcial Y: calificacin final

Se observa que al incrementar x (variable de prediccin) tambin se incrementa y (respuesta) con una tendencia aproximadamente lineal Modelo de regresin lineal poblacional propuesto

Y = 0 + 1 x + , i N(0, 2), para cada Yi

272

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

11.1

RECTA DE MNIMOS CUADRADOS

El siguiente procedimiento matemtico permite usar los datos dados para construir una recta de la cual se obtienen estimadores para los parmetros 0 y 1 de la recta de regresin poblacional 0 + 1 x, Se trata de colocar una recta entre los puntos dados, de la forma mejor balanceada con el criterio de hacer que la suma de las distancias de la recta a los puntos sea la menor posible. Esta recta se denomina recta de mnimos cuadrados. Definicin: Recta de mnimos cuadrados

   y = 0 + 1 x

En donde

  0 , 1 son los estimadores de 0 y 1 del modelo poblacional 0 + 1 x

Recta de mnimos cuadrados    y = 0 + 1 x

Para cada valor x i se tiene el dato observado    cuadrados y = 0 + 1 x con este mismo valor

yi , mientras que al evaluar la recta de mnimos    x i se obtiene el valor y i = 0 + 1 x i

Sea ei = yi yi , la diferencia entre estos dos valores. Esta diferencia se denomina el residual. Entonces, el criterio de mnimos cuadrados consiste en minimizar e i para todos los puntos. El cuadrado puede interpretarse como una manera de cuantificar las diferencias sin importar el signo. La verdadera razn es formal y corresponde a la teora de la estimacin estadstica. Definicin: Suma de los cuadrados del error
n i=1 2 i n i =1 i =1

   2 n 2 SCE = e = ( y i y i ) = ( y i 0 1x i )

SCE es una funcin con dos variables:

  0 , 1

Con el procedimiento matemtico usual para encontrar su mnimo: SCE SCE = 0, =0 0 1 Despus de derivar SCE, igualar a cero y simplificar se llega al sistema de ecuaciones lineales: n   n 0n + 1 xi = yi
  0 xi + 1 xi2 =
i =1 i=1 n i =1 n i =1 n

xi yi
i=1

De donde se obtienen finalmente 0 , 1 para el modelo de mnimos cuadrados:    y = 0 + 1 x . Este modelo puede usarse para realizar pronsticos

273

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Obtener la recta de mnimos cuadrados para el ejemplo

   y = 0 + 1 x
xi 39 43 21 64 57 43 38 75 34 52 466
 0n

i 1 2 3 4 5 6 7 8 9 10

yi 65 75 52 82 92 80 73 98 56 75 748

x2i 1521 1849 441 4096 3249 1849 1444 5625 1156 2704 23934

xiyi 2535 3225 1092 5248 5244 3440 2774 7350 1904 3900 36712

i=1

10

 n + 1 xi =
i =1 n

yi
i =1

 n  n 0 xi + 1 xi2 =
i=1 i =1

xi yi
i =1

  10 0 + 466 1 = 748   466 0 + 23934 1 = 36712

De donde se obtienen Recta de mnimos cuadrados:

  0 = 35.83, 1 = 0.836

 y = 35.83 + 0.836 x

Pronosticar la calificacin final si la calificacin parcial es 50

 y = 35.83 + 0.836 (50) = 77.63

11.2

COEFICIENTE DE CORRELACIN

Para determinar el tipo de relacin lineal entre las variables x y y del modelo de regresin lineal se usa el coeficiente de correlacin lineal que se define a continuacin: Para simplificar la escritura se establecen las siguientes definiciones 1 n 1 n x = xi y = yi n i=1 n i=1 n n Sxx = (x i x ) 2 Syy = ( yi y) 2 i=1 i=1 n Sxy = (x i x )( yi y) i=1 Definicin: Coeficiente de correlacin

r=

Sxy , 1 r 1 Sxx Syy

El signo de r es igual al signo de la pendiente

 1 de la recta de regresin lineal

Si el valor de r es cercano a 1 significa que hay una fuerte relacin lineal positiva ente x y y Si el valor de r es cercano a -1 significa que hay una fuerte relacin lineal negativa ente x y y Si el valor de r es cercano a 0 significa que hay poca relacin lineal ente x y y

274

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Fig. Ejemplos de correlacin entre dos variables Calcular el coeficiente de correlacin para el ejemplo 1 n 1 x = x i = (39 + 43 + . . . + 52) = 46.6 10 n i=1 1 n 1 (65 + 75 + . . . + 75) = 74.8 y = yi = 10 n i=1 n Sxx = (x i x ) 2 = [(39 46.6)2 + (43 46.6)2 + . . . + (52 46.6)2] = 2218.4 i=1 n S yy = ( yi y) 2 = [(65 74.8)2 + (75 74.8)2 + . . . + (75 74.8)2] =1885.6 i=1 n Sxy = (x i x )( yi y) = [(39 46.6)(65 74.8) + . . . ] = 1855.2 i=1

r=

Sxy 1855.6 = = 0.9071 (2218.4)(1885.6) Sxx Syy

El resultado indica una fuerte correlacin lineal positiva

11.3

ANLISIS DEL MODELO DE REGRESIN LINEAL SIMPLE

Para simplificar la escritura de algunas expresiones de inters, se definen las siguientes frmulas equivalentes que pueden demostrarse algebraicamente desarrollando las sumatorias. 2 n n n 2 1 2 (1) Sxx = (x i x ) = x i x i n i=1 i=1 i=1 (2)
n n 1 n n Sxy = (x i x )( yi y) = x i yi x i y i n i=1 i=1 i = 1 i = 1 2 SCT = Syy = ( yi y) = yi i=1 i=1 n S2 xy  2 SCE = ( yi yi ) = S yy Sxx i=1 n S2 xy  2 SCR = ( yi y) = S xx i=1 2 n n

(3)

1 n yi n i=1

(4)

(5)

275

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Demostracin de (1) n n n n 2 2 2 2 Sxx = (x i x ) 2 = (x i 2x i x + x ) = x i 2 x x i + nx i=1 i=1 i=1 i=1 n n n n 1 2 2 2 2 2 2 = x i 2xn x i + nx = x i 2 xnx + nx = x i nx n i=1 i=1 i=1 i=1

i= 1

xi2

n(

xi
i=1

2 = xi i=1

1 n xi n i=1

esto completa la demostracin

11.4

ANLISIS DE VARIANZA

El anlisis de varianza es un mtodo estadstico para conocer si los valores de un grupo de datos son significativamente diferentes de otro(s) grupo(s) de datos. Este mtodo se puede aplicar al modelo de regresin lineal. Algunos supuestos son necesarios para su aplicacin, entre estos, que las observaciones sean independientes y que la distribucin de la variable dependiente sea normal. Consideremos la frmula (4):

S2 xy  2 SCE = ( yi yi ) = S yy Sxx i=1


n
Se puede escribir

S yy =

S2 xy S xx

+ SCE

Sustituyendo la frmula (5)

S yy = SCR + SCE
Sustituyendo la definicin de la frmula (3)

SCT = SCR + SCE

Con la sustitucin de las equivalencias de las frmulas (3), (4) y (5) se obtiene

Definicin: Descomposicin de la variabilidad para el modelo de regresin lineal

i=1

  ( y i y) 2 = ( y i y) 2 + ( y i y i ) 2
i=1 i=1

Esta frmula permite descomponer la variabilidad total SCT de la variable de respuesta (y) en dos componentes: la variabilidad SCR correspondiente a la recta de regresin de mnimos cuadrados, y la variacin residual SCE que no se ha incluido en la recta de mnimos cuadrados obtenida

SCT: Suma de cuadrados total SCR: Suma de cuadrados de regresin SCE: Suma de cuadrados del error
Mientras menor es el valor de SCE, mayor es la eficacia del modelo de mnimos cuadrados obtenido, pues su variabilidad se ajusta o explica muy bien a la variabilidad de los datos y..

276

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Encontrar los componente de variacin para el modelo del ejemplo

SCT = SCR + SCE


SCT =

(yi y)2 = (65 74.8)2 + (75 74.8)2 + . . . + (75 74.8)2 = 1885.6


i=1

 y = 35.83 + 0.836 x (Recta de mnimos cuadrados obtenida)  x=39: y = 35.83 + 0.836 (39) = 68.434  x=43: y = 35.83 + 0.836 (43) = 71.778  x=52: y = 35.83 + 0.836 (52) = 79.302
SCR = ...

(yi y)2
i=1
n

= (68.434 74.8)2 + (71.778 74.8)2 + . . . + (79.302 74.8)2 = 1550.4 SCE =

(y
i=1

yi )2

= (65 68.434)2 + (75 71.778)2 + . . . + (75 79.302)2 = 334.138


Tambin se puede usar la definicin para obtener directamente uno de los tres componentes:
SCT = SCR + SCE

11.5

COEFICIENTE DE DETERMINACIN

El coeficiente de determinacin es otra medida de la relacin lineal entre las variables x y y Es til para interpretar la eficiencia de la recta de mnimos cuadrados para explicar la variacin de la variable de respuesta (y)

Definicin: Coeficiente de determinacin

r2 =
2

SCR 2 , 0r 1 SCT
2

El valor de r mide el poder de explicacin del modelo de mnimos cuadrados. Si r es cercano a 1 significa que la recta de mnimos cuadrados se ajusta muy bien a los datos.

Calcular el coeficiente de determinacin para el ejemplo

r2 =

SCR 1550.4 = = 0.8222 SCT 1885.6

El poder de explicacin del modelo de mnimos cuadrados es 82.22%

277

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

11.6

TABLA DE ANLISIS DE VARIANZA

En la ecuacin

SCT = SCR + SCE


SCR tiene 1 grado de libertad (varianza ponderada con el modelo con dos parmetros) SCE tiene n 2 grados de libertad (existen n datos y dos parmetros en el modelo) SCT tiene n 1 grados de libertad (suma de grados de libertad de SCR y SCT)
Si cada uno se divide por el nmero de grados de libertad se obtienen los cuadrados medios Todos estos resultados se los ordena en un cuadro denominado Tabla de Anlisis de Varianza o Tabla ANOVA

Tabla ANOVA Fuente de variacin Regresin Error Total Grados de libertad 1 n2 n1 Suma de cuadrados SCR SCE SCT Cuadrados medios SCR/1 S2 = SCE/(n 2) F0
(SCR/1)/(SCE/(n-2))

El ltimo cociente es el valor de una variable que tiene distribucin F. Este estadstico se usa para una prueba del modelo propuesto

Escribir la tabla de anlisis de varianza para el ejemplo Fuente de variacin Regresin Error Total Grados de libertad 1 8 9 Suma de cuadrados 1550.4 335.2 1885.6 Cuadrados medios 1550.4 41.9 F0 37.00

11.7

PRUEBA DE DEPENDENCIA LINEAL DEL MODELO

Puede demostrarse que el estadstico SCR F0 = tiene distribucin F con 1 = 1, 2 = n 2 grados de libertad SCE /(n 2) Este estadstico se puede usar para realizar una prueba de hiptesis para la pendiente del modelo de regresin lineal H0: 1 = 0, Hiptesis nula para probar que no hay dependencia lineal entre x y y Ha: H0 Si se especifica el nivel de significancia de la prueba, entonces la regin crtica es Rechazar H0 si f0 > f con 1 = 1, 2 = n 2 grados de libertad

Probar con 5% de significancia de dependencia lineal para el ejemplo H0: 1 = 0


Regin de rechazo de H0: f0 > f0.05 con 1 = 1, 2 = 8 f0.05, 1, 8 = 5.32

(Tabla F)

Conclusin Debido a que f0 > 5.32, se rechaza H0, es decir x y y si estn relacionadas linealmente

278

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

ESTIMACIN DE LA VARIANZA 2 La varianza de los errores del modelo es desconocida. Para poder hacer inferencias acerca de los parmetros 0 , 1 es necesario un estimador.
Definicin: Varianza muestral
S2 = SCE = n2
 )2 (yi y i
I=1 n

11.8

n2

Es un estimador insesgado de la varianza del modelo terico: La variable aleatoria 2 = (n 2)


S2 2

E[S2] = .

tiene distribucin jicuadrado con n 2 g. de libertad.

Estimacin de la varianza para el ejemplo SCE 334.138 s2 = = = 41.7673 n2 8

11.9

INFERENCIAS CON EL MODELO DE REGRESIN LINEAL Y = 0 + 1 x + , i N(0, 2) para cada variable aleatoria Yi

En el modelo probabilista propuesto:

El valor esperado de este modelo, es una recta desconocida con parmetros 0 y 1

E[Y] = 0 + 1 x

   y = 0 + 1 x   En donde 0 , 1 son los estimadores de los parmetros 0 , 1


Los estimadores son variables aleatorias pues dependen de los valores y observados. Si los componentes i del error son independientes, puede demostrarse que estimadores insesgados, con distribucin normal y con las siguientes varianzas:

El modelo obtenido con el mtodo de mnimos cuadrados es

  0 , 1 son

E[0 ] = 0, E[1 ] = 1,

V[0 ] =




2  0

= [
2

x
i=1

2 i

nSxx

2 V[1 ] =  =
1

2 Sxx

Para definir estadsticos con los estimadores por el estimador S2

  0 , 1 se sustituye la varianza desconocida 2

2 S  0

=S [

2 i =1

xi2
nSxx

2 S  1

S2 = Sxx

Definicin: Estadsticos para estimacin de los parmetros 0 y 1

t=

 0 0
2 S
0

t=

 1 1
2 S
1

Tienen distribucin t con = n 2 grados de libertad.

279

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Varianza de los estimadores de mnimos cuadrados en el ejemplo

2 S  0

392 + 432 + ... + 52 ) = 45.0575 =S [ ] = 41.7673 ( 10(2218.4) nSxx


2 i= 1

xi2

2 S  =
1

S2 41.7673 = = 0.0188 2218.4 Sxx

11.10 INFERENCIAS ACERCA DE LA PENDIENTE DE LA RECTA


Es importante determinar si existe una relacin entre las variables x y y. Esta relacin est determinada por la pendiente 1 de la recta.

11.10.1 INTERVALO DE CONFIANZA Parmetro: 1 (Pendiente de la recta de regresin lineal terica)  Estimador: 1 (Pendiente de la recta de mnimos cuadrados)
El estadstico

t=

 1 1
2 S
1

, tiene distribucin t con = n 2 grados de libertad

Como es usual, la desigualdad t/2 t t/2 tiene probabilidad 1 , de donde:

Definicin: Intervalo de confianza para la pendiente 1 con nivel 1

 1 t/2

 2 S  < 1 < 1 + t/2


1

2 S 

Intervalo de confianza para 1 con nivel 95% para el ejemplo 1 = 0.95 t/2 = t0.025 = 2.306, = 8 grados de libertad

 1 t/2

 2 S  < 1 < 1 + t/2


1

2 S 

0.836 2.306

0.5196 < 1 <1.1524

0.0188 < 1 < 0.836 + 2.306 0.0188

Es el intervalo para la pendiente de la recta de regresin lineal

11.10.2 PRUEBA DE HIPTESIS Parmetro: 1 (Pendiente de la recta de regresin lineal terica)  Estimador: 1 (Pendiente de la recta de mnimos cuadrados)
H0: Ha:

1 = b1 1 b1 1 < b1 1 > b1

(b1 = 0, para probar que no hay relacin lineal entre x y y)

Estadstico de prueba

t=

 1 b1
2 S
1

, tiene distribucin t con = n 2 grados de libertad

280

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Si se especifica el nivel de significancia se puede definir la regin crtica 1 < b1 : t < -t 1 > b1 : t > t 1 b1 : t < -t/2 t > t/2

Prueba de hiptesis con 5% de significancia que 1 < 1 para el ejemplo H0: 1 = 1 Ha: 1 < 1 = 0.05 Regin de rechazo de H0: t < -t0.05, = 8 t < -1.86
Clculo del estadstico de prueba

t=

 1 b1
2 S
1

0.836 1 0.0188

= 1.196

Conclusin La evidencia no es suficiente para rechazar que la pendiente del modelo es 1

11.11 INFERENCIAS PARA LA INTERCEPCIN DE LA RECTA


Tambin puede ser de inters probar si la intercepcin de la recta de regresin es igual a algn valor especificado

11.11.1 INTERVALO DE CONFIANZA Parmetro: 0 (Intercepcin de la recta de regresin lineal terica)  Estimador: 0 (Intercepcin de la recta de mnimos cuadrados)
El estadstico

t=

 0 0
2 S
0

tiene distribucin t con = n 2 grados de libertad

La desigualdad t/2 t t/2 se satisface con probabilidad 1 , de donde se obtiene

Definicin: Intervalo de confianza para la intercepcin 0 con nivel 1

 0 t/2

 2 S  < 0 < 0 + t/2


0

2 S 

Intervalo de confianza para 0 con nivel 95% para el ejemplo 1 = 0.95 t/2 = t0.025 = 2.306, = 8 grados de libertad

 0 t/2

 2 S  < 0 < 0 + t/2


0

2 S 

35.83 2.306 45.0575 < 0 < 35.83 + 2.306 45.0575 20.351 < 0 <51.309
Es el intervalo para la intercepcin de la recta de regresin lineal

281

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

11.11.2 PRUEBA DE HIPTESIS Parmetro: 0 (Intercepcin de la recta de regresin lineal terica)  Estimador: 0 (Intercepcin de la recta de mnimos cuadrados)
H0: Ha:

0 = b0 0 b0 0 < b0 0 > b0

(b0: algn valor especificado para la intercepcin)

Estadstico de prueba

t=

 0 b0
2 S
0

, tiene distribucin t con = n 2 grados de libertad

Si se especifica el nivel de significancia se puede definir la regin crtica 0 < b0 : t < -t 0 > b0 : t > t 0 b0 : t < -t/2 t > t/2

Prueba de hiptesis con 5% de significancia que 0 > 30 para el ejemplo H0: 0 = 30 Ha: 0 > 30 = 0.05 Regin de rechazo de H0: t > t0.05, = 8 t > 1.86 Clculo del estadstico de prueba

t=

 0 b0
2 S
0

35.83 30 45.0575

= 0.8685

Conclusin La evidencia no es suficiente para rechazar que la intercepcin del modelo es 30

11.12 PRUEBA DE LA NORMALIDAD DEL ERROR


Se puede usar la prueba K-S para probar la suposicin de normalidad de los errores

Prueba de Kolmogorov-Smirnov con 5% de significancia para lanormalidad del error con los datos del ejemplo Ho: N(0, ) Ha: Ho = 0.05
2

(Distribucin normal con media 0 y varianza 2)

Estadstico de prueba Dn = max| Sn(xi) F0(xi)| Regin de rechazo de Ho

(Para este ejemplo xi son los valores ei)


(Tabla K-S)

= 0.05, n = 10 D0.05 = 0.410


Rechazar H0 si Dn > 0.410

282

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

 i ei = yi - yi , i =1, 2, ..,, 10  y = 35.83 + 0.836 x




(Recta de mnimos cuadrados obtenida)

x1 = 39 y1 = 35.83 + 0.836 (39) = 68.434  e1 = y1 - y1 = 65 68.434 = 3.434, etc.


e1 3.434 e 3.222 2 e3 1.386 e 4 7.334 e5 8.518 = e6 8.222 e 5.4020 7 e8 0.530 e9 8.254 4.302 e10

e 0 F0(xi) = F0(ei) = P(Z< i ) Distribucin normal estndar acumulada 2 S2 = 41.7673 S = 6.4627


8.254 0 ) = 0.1008, etc. (Datos e ordenados) 6.4627 Tabulacin de resultados con la notacin xi = ei

Modelo propuesto ei N(0, )

(Aproximadamente)

F0(x1) = F0(e1) = P(Z<

i 1 2 3 4 5 6 7 8 9 10

xi (ordenados) -8.254 -7.334 -4.302 -3.434 -1.386 -0.530 3.222 5.402 8.222 8.518

Sn(xi) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

F0(xi) 0.1008 0.1282 0.2528 0.2976 0.4151 0.4673 0.6910 0.7984 0.8984 0.9063

|Sn(xi)- F0(xi)| 0.0008 0.0718 0.0472 0.1024 0.0849 0.1327 0.0090 0.0016 0.0984 0.0937

Dn = max| Sn(xi) F0(xi)| = 0.1327


Conclusin: Dn no cae en la regin de rechazo, por lo tanto no se puede rechazar Ho

283

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIOS
Los siguientes datos, en miles de dlares, representan los ingresos por ventas vs. los gastos de promocin de un producto: Gastos: Ingresos:

0.5 3.5

1.0 4.1

1.5 5.5

2.0 7.2

2.5 8.7

3.0 9.5

Suponga que la variable de prediccin (X) corresponde a los gastos, y la variable de respuesta (Y) se refiere a los ingresos. a) b) c) d) e) f) g) h) i) j) Construya un diagrama de dispersin de los datos Encuentre la recta de mnimos cuadrados Calcule el coeficiente de correlacin e interprete el resultado Construya la tabla ANOVA Calcule el coeficiente de determinacin e interprete el resultado Encuentre una estimacin para la varianza de los errores del modelo Encuentre la varianza de los estimadores del modelo de mnimos cuadrados Construya un intervalo de confianza de 95% para la pendiente del modelo Pruebe con 5% de significancia que la pendiente del modelo es mayor a 2 Pruebe la normalidad del error con la prueba K-S

284

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Regresin lineal simple usando notacin matricial
>> x=[1 39 ; 1 43 ; 1 21; 1 64; 1 57; 1 43; 1 38; 1 75;1 34;1 52] Matriz de diseo X x= 1 39 1 43 1 21 1 64 1 57 1 43 1 38 1 75 1 34 1 52 >> y=[ 65; 75; 52; 82; 92; 80; 73; 98; 56; 75] Vector de observaciones y= 65 75 52 82 92 80 73 98 56 75 >> [b, bint, e, eint, stats] = regress(y,x, 0.05) Regresin lineal simple = 0.05 b= 35.8294 Coeficientes 0 , 1 del modelo de mnimos cuadrados 0.8363 bint = 20.3497 51.3092 Intervalos de confianza para 0 , 1 0.5199 1.1527 Vector de residuales e= -3.4443 3.2106 -1.3913 -7.3512 8.5027 8.2106 5.3920 -0.5503 -8.2629 -4.3159 stats = 0.8228 37.1456 0.0003 Coeficiente de determinacin R2, valor del estadstico F, valor p de la prueba F

Uso del modelo de mnimos cuadrados


>> yp=b(1) + b(2)*50 yp = 77.6433
Evaluar el modelo con x = 50

285

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Matriz de correlacin de los datos de la muestra


>> mc = corrcoef(x(:,2),y) mc = 1.0000 0.9071 0.9071 1.0000
Vectores columnas X, Y Coeficiente de correlacin lineal r = 0.9071

Grfico de los puntos muestrales y la recta de regresin


>> clf Grfico de dispersin >> scatter(x(:,2),y,'filled'),grid on Grfico de la recta de regresin >> hold on, ezplot('35.8294+0.8363*x',[20, 80]) >> legend('Recta de regresion','Datos muestrales',2) Rtulos

Prueba de la normalidad del error de los residuales


>> sce=sum(e.^2) sce = 334.1363 >> s2=sce/8 s2 = 41.7670 >> t=sort(e); >> f=normcdf(t, 0, sqrt(s2)); >> [h,p,ksstat,vc]=kstest(t, [t f ], 0.05,0) h= 0 p= 0.9891 ksstat = 0.1339 vc = 0.4093
Suma de los cuadrados de residuales Estimacin de la varianza S2

Residuales ordenados 2 Modelo a probar ei N(0, )r Prueba K-S, = 0.05 No se puede rechazar el modelo Valor p de la prueba Valor del estadstico de prueba Valor crtico de la regin de rechazo

Matriz de varianzas y covarianzas de los estimadores i


>> mvc = inv(x' *x)*s2 mvc = 45.0619 -0.8774 -0.8774 0.0188
Usando notacin matricial

V(0) = 45.0619, V(1) = 0.0188 Cov(0 , 1) = -0.8774

286

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

12

REGRESIN LINEAL MLTIPLE

Consideramos el caso de una variable Y que suponemos depende linealmente de otras k variables x1, x2, ... , xk . Para describir esta relacin se propone un modelo de regresin lineal mltiple poblacional Definicin: Modelo de regresin lineal mltiple

Y = 0 + 1 x1 + 2 x2 + ... + k xk +
En donde 0, 2, . . . , k son los parmetros que deben estimarse para el modelo, mientras que es el componente aleatorio de Y. Cuando k = 1, se obtiene el modelo de regresin lineal simple previamente estudiado. Suponer que se tiene una muestra aleatoria (x1,i, x2,i, ..., xk,i, yi), i = 1, 2, ..., n Para cada grupo de k valores x1,i, x2,i, ..., xk,i se tiene un resultado u observacin yi. Este es uno de los posibles valores de la variable aleatoria Yi. Una variable aleatoria debe tener una distribucin de probabilidad. La aleatoriedad de Yi est dada por i. Se supondr que para cada variable aleatoria Yi el componente aleatorio i es una variable con la misma distribucin de probabilidad, y que adems son variables independientes. Para comprensin de conceptos se desarrolla paralelamente un ejemplo

Ejemplo
Se desea definir un modelo de regresin relacionando la calificacin final en cierta materia con la calificacin parcial y el porcentaje de asistencia a clases. Para el anlisis se usar una muestra aleatoria de 6 estudiantes que han tomado esta materia. Estudiante Nota Parcial X1 % Asistencia X2 Nota Final Y 1 67 75 80 2 65 78 77 3 78 79 94 4 60 83 70 5 64 65 51 6 61 76 70

Diagramas de dispersin: y vs. x1, y vs. x2

y vs. X1

y vs. X2

Modelo terico de regresin lineal mltiple propuesto

Y = 0 + 1 x1 + 2 x2 +

287

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

12.1

MTODO DE MNIMOS CUADRADOS

El siguiente procedimiento matemtico permite usar los datos dados para construir un modelo con el cual se obtienen

   0 , 1 , ..., k que sern los estimadores de los parmetros

0 , 1 , ..., k del modelo terico de regresin lineal mltiple propuesto.


Definicin: Modelo de mnimos cuadrados

     y = 0 + 1 x 1 + 2 x 2 + ... + k x k    En donde 0 , 1 , ..., k son los k+1 estimadores para los k+1 parmetros 0 , 1 , ..., k
Para cada valor

x i se tiene el dato observado yi , mientras que al evaluar el modelo de  mnimos cuadrados con este mismo valor x i se obtiene el valor yi 

Sea ei = yi yi , la diferencia entre estos dos valores. Esta diferencia se denomina el residual. Definicin: Suma de los cuadrados del error

     2 n 2 SCE = e = ( y i y i ) = ( y i 0 1x 1,i 2 x 2 ,i ... k x k ,i )


n n i=1 2 i i=1 i=1

SCE es una funcin con k + 1 variables:

   0 , 1 , ..., k

Usando el conocido procedimiento matemtico para minimizar SCE:

SCE = 0, i=0, 1, 2, ... , k 


i

Resulta un sistema de k+1 ecuaciones lineales de donde se obtienen los k+1 estimadores

   0 , 1 , ..., k

12.2

MTODO DE MNIMOS CUADRADOS PARA k = 2 Supongamos que Y depende de dos variables x1, x2
Modelo terico de regresin lineal mltiple propuesto:

Y = 0 + 1 x1 + 2 x2 +
Modelo de mnimos cuadrados;

    y = 0 + 1 x1 + 2 x 2    SCE = 0, i = 0, 1, 2 . Para encontrar 0 , 1 , 2 , derivar SCE e igualar a cero:  i


Luego de la aplicacin y simplificacin algebraica se obtiene
n   n  n n 0 + 1 x 1,i + 2 x 2 ,i = y i i =1 i =1 i=1 n    2 0 x 1,i + 1 x 1 + x x = x 1,i yi 2 1,i 2 ,i ,i n n n i =1 n i =1 n i =1 i=1 n    0 x 2 ,i + 1 x 2 ,i x 1,i + 2 x 2 = x 2,i yi 2 ,i n i =1 i =1 i=1 i =1

Al resolver este sistema lineal se obtienen los estimadores

   0 , 1, 2

288

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

El sistema de ecuaciones se puede expresar en notacin matricial A =C Siendo

n n A = x 1,i i=1 n x 2 ,i i=1

x 1,i x
i =1 i =1 n 2 1,i

x
i =1

2 ,i

x 1,i

x 2 ,i  i=1 0   x 1,i x 2 ,i , = 1 , C = i =1  n 2 x2 2 ,i i=1


n

n yi n i =1 x y 1,i i i=1 n x 2 ,i y i i=1

12.3

REGRESIN LINEAL MLTIPLE EN NOTACIN MATRICIAL

En esta seccin se describe la notacin matricial para expresar el modelo de regresin lineal mltiple. Esta notacin es usada despus para el modelo de regresin de mnimos cuadrados. Consideramos el caso especfico k = 2 en donde Y depende de dos variables x1, x2 Modelo de regresin lineal poblacional propuesto: Y = 0 + 1 x1 + 2 x2 + , i N(0, 2) Datos de la muestra:

(x1,i, x2,i, yi), i = 1, 2, ..., n


Cada observacin yi es un valor de la variable aleatoria Yi, i = 1, 2, ..., n Yi = 0 + 1 x1,i + 2 x2,i + i ,i= 1, 2, ..., n En forma desarrollada,

Y1 = 0 + 1 x1,1 + 2 x2,1 + 1 Y2 = 0 + 1 x1,2 + 2 x2,2 + 2 . . . Yn = 0 + 1 x1,n + 2 x2,n + n


El modelo terico expresado en notacin matricial es

Y1 1 x1,1 Y 1 x 1,2 2 . . = . . . . Yn 1 x1,n


En forma simblica Y=X +

x 2,1 1 x 2,2 0 2 . 1 + . . 2 . x 2,n n

289

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

En donde

Y1 Y 2 Y= . , . Yn

1 x 1,1 1 x 1,2 . . X= . . 1 x 1,n

x 2,1 x 2,2 . , . x 2,n

0 = 1 , 2

1 2 = . . n

La matriz X se denomina matriz de diseo El sistema de ecuaciones del modelo de regresin lineal mltiple de mnimos cuadrados, k=2 A =C puede entonces expresarse con la notacin matricial desarrollada para el modelo terico: La matriz de coeficientes A se puede construir con la matriz de diseo X

n n A = x 1,i i=1 n x 2 ,i i=1

x 1,i x
i =1 i =1 i =1 n 2 1,i

x 2,i x 1,i

i=1 1 x 1,i x 2 ,i = x 1,1 i =1 n x 2 ,1 2 x 2 ,i i=1

2 ,i

1 x 1,2 x 2,2

1 x 1,1 . . 1 1 x 1,2 . . . x 1,n . . . . . x 2,n . 1 x 1,n

x 2 ,1 x 2 ,2 . . x 2 ,n

En forma simblica:

A = XT X

El vector C puede expresarse tambin con la matriz de diseo X

n yi 1 n i =1 C = x 1,i y i = x 1,1 i =1 n x 2 ,1 x 2 ,i y i i =1
En forma simblica:

1 x 1,2 x 2 ,2

y1 . . 1 y2 . . x 1,n . . . . x 2 ,n . yn

C = XT y

Con esta notacin el modelo de mnimos cuadrados se puede escribir A = C XT X = XT y

 1   En donde = 2 ,  3

y1 y 2 y= . . yn

Finalmente, con la inversa de XT X se pueden obtener los estimadores de mnimos cuadrados:

 = (XT X)-1 (XT y)

290

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Siendo

 :
X: y:

Vector con los estimadores de mnimos cuadrados Matriz de diseo (construida con los datos de la muestra) Vector de observaciones obtenidas en la muestra

La extensin de la notacin matricial para k > 2 es directa Modelo de regresin lineal en notacin matricial para el ejemplo Modelo de regresin lineal poblacional propuesto:

Y = 0 + 1 x1 + 2 x2 +
En notacin matricial Y=X + En forma desarrollada, n = 6 Y1 1 x1,1 x 2,1 1 Y 1 x x 2,2 1,2 2 2 0 Y3 1 x1,3 x 2,3 3 1 + = Y4 1 x1,4 x 2,4 4 Y 1 x1,5 x 2,5 2 5 5 Y6 6 1 x1,6 x 2,6 Matriz de diseo con los datos 1 67 75 1 65 78 1 78 79 X= 1 60 83 1 64 65 1 61 76

Obtener el modelo de mnimos cuadrados para el ejemplo (usar la matriz de diseo)

    y = 0 + 1 x1 + 2 x 2
 = (XT X)-1 (XT y)
 0  1  2
1 67 75 1 1 1 1 1 1 1 65 78 1 78 79 = 67 65 78 60 64 61 1 60 83 75 78 79 83 65 76 1 64 65 1 61 76
395 456 6 = 395 26215 30033 456 30033 34840
1

80 77 1 1 1 1 1 1 94 67 65 78 60 64 61 70 75 78 79 83 65 76 51 70

442 29431 33877

02880 48.974 = 0.2880 4.760x103 4 0.3927 3.366x10

442 3.360x10 29431 33877 5.458x10 3


4

0.3927

134.07 = 1.4888 1.4437

Modelo de mnimos cuadrados para el ejemplo

    y = 0 + 1 x1 + 2 x2 = 134.07 + 1.4888 x1 + 1.4437 x 2

291

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Pronosticar la calificacin final de un estudiante si la calificacin parcial es 75 y el porcentaje de asistencia a clases es 80

 y = 134.07 + 1.4888 (75) + 1.4437(80) = 93.08

12.4 ANLISIS DE VARIANZA


Para este modelo tambin se aplica la misma interpretacin de las fuentes de variacin con las siguientes definiciones, similares al modelo de regresin lineal simple: 1 n y = yi n i=1

SCT =

(yi y)2
i= 1

SCE =

 (yi yi )2
i= 1

SCR =

(yi y)2
i= 1

Se obtiene la relacin entre las fuentes de error del modelo de regresin lineal mltiple

SCT = SCR + SCE


n n n

i=1

  ( y i y) 2 = ( y i y) 2 + ( y i y i ) 2
i=1 i=1

Esta frmula permite descomponer la variabilidad total SCT de la variable de respuesta (y) en dos componentes: la variabilidad SCR correspondiente al modelo de regresin de mnimos cuadrados, y la variacin residual SCE que no se ha incluido en el modelo calculado

SCT: Suma de cuadrados total SCR: Suma de cuadrados de regresin SCE: Suma de cuadrados del error
Mientras menor es el valor de propuesto.

SCE, mejor es la eficacia del modelo de mnimos cuadrados

Anlisis de varianza para el ejemplo

SCT = SCR + SCE 1 n 1 y = yi = (80 + 77 + 94 + 70 + 51 + 70) = 73.6666 6 n i=1


 y = 134.07 + 1.4888 x 1 + 1.4437x 2 (Modelo de mnimos cuadrados obtenido)
x1 = 67, x2 = 75: x1 = 65, x2 = 78: ... x1 = 61, x2 = 76:
n

 y = -134.07 + 14888(67) + 1.4437(75) = 73.9571  y = -134.07 + 14888(65) + 1.4437(78) = 75.3106  y = -134.07 + 14888(61) + 1.4437(76) = 66.4680

SCT =

(yi y)2 = (80 73.6666)2 + (77 73.6666) + . . . + (70 73.6666)2 = 1005.3


i=1

292

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

SCR =

(yi y)2
i=1

= (73.9571 73.6666)2 + (75.3106 73.6666)2 + . . . + (66.4680 73.6666)2 = 906.7070

SCE =

(y
i=1

yi )2

= (80 73.9571)2 + (77 75.3106)2 + . . . + (70 66.4680)2 = 98.5831 Tambin se puede usar la definicin para obtener directamente uno de los tres componentes: SCT = SCR + SCE

12.5 COEFICIENTE DE DETERMINACIN


El coeficiente de determinacin es otra medida de la relacin lineal entre las variables x y y Es til para interpretar la eficiencia del modelo de mnimos cuadrados para explicar la variacin de la variable de respuesta

Definicin: Coeficiente de determinacin

r2 =
2

SCR 2 , 0r 1 SCT
2

El valor de r mide el poder de explicacin del modelo de mnimos cuadrados. Si r es cercano a 1 significa que el modelo de mnimos cuadrados se ajusta muy bien a los datos.

Coeficiente de determinacin para el ejemplo

r2 =

SCR 906.707 = = 0.9019 SCT 1005.3

= 90.19%

El poder de explicacin del modelo de mnimos cuadrados es 90.19%

12.6 TABLA DE ANLISIS DE VARIANZA


En la ecuacin
SCT = SCR + SCE

grados de libertad (varianza ponderada con el modelo con k+1 parmetros) SCR tiene k SCE tiene n k 1 grados de libertad (existen n datos y k parmetros en el modelo) SCT tiene n 1 grados de libertad Si cada uno se divide por el nmero de grados de libertad se obtienen los cuadrados medios Todos estos resultados se los ordena en un cuadro denominado Tabla de Anlisis de Varianza o Tabla ANOVA

Tabla ANOVA Fuente de variacin Regresin Error Total

Grados de libertad k nk1 n1

Suma de cuadrados SCR SCE SCT

Cuadrados medios SCR/k SCE/( n k 1)

F0
(SCR/k)/(SCE/( nk1))

El ltimo cociente es el valor de una variable que tiene distribucin F. Este estadstico se usa para una prueba del modelo propuesto

293

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Tabla de anlisis de varianza para el ejemplo Fuente de variacin Regresin Error Total Grados de libertad 2 3 5 Suma de cuadrados 906.707 98.5831 1005.3 Cuadrados medios 453.3535 32.8610 F0
13.7961

12.7 PRUEBA DE DEPENDENCIA LINEAL DEL MODELO


Puede demostrarse que el estadstico SCR / k F0 = tiene distribucin F con 1 = k, 2 = n k 1 grados de libertad SCE /(n k 1) Este estadstico se puede usar para realizar una prueba de hiptesis para determinar la dependencia lineal del modelo de regresin lineal propuesto

H0: 1 =....= k =0, Ha: H0

No hay dependencia lineal de y con las Xi La respuesta Y depende linealmente de al menos una variable Xi

Si se especifica el nivel de significancia de la prueba, entonces la regin crtica es Rechazar H0 si f0 > f con 1 = k, 2 = n k 1 grados de libertad

Prueba con 5% de significancia de la dependencia lineal para el ejemplo H0: 1 = 2 =0


Regin de rechazo de H0: f0.05 con 1 = 2, 2 = 3 Rechazar H0 si f0 > 9.55

f0.05, 2, 3 = 9.55

(Tabla F)

Conclusin: Debido a que f0 =13.7961 es mayor a 9.55, se rechaza H0, es decir que al menos una de las variables independientes x1, x2 contribuyen significativamente al modelo

12.8 ESTIMACIN DE LA VARIANZA


La varianza de los errores del modelo es desconocida. Para poder hacer inferencias acerca de los parmetros 0 , 1, . . ., k es necesario un estimador.
2

Definicin: Varianza muestral


 )2 (yi y i
I=1 n

SCE S2 = = nk1

nk 1

Es un estimador insesgado de la varianza del modelo terico:

E[S2] =

Estimacin de la varianza muestral para el ejemplo

S2 =

SCE 98.583 = = 32.861 nk1 621

294

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

12.9 MATRIZ DE VARIANZAS Y COVARIANZAS


Es una forma ordenada de expresar las varianzas y covarianzas de los estimadores del modelo de regresin lineal La estadstica matemtica demuestra la siguiente expresin matricial denominada matriz de varianzas y covarianzas, con la cual se pueden definir los estadsticos de prueba

Definicin: Matriz de varianzas y covarianzas

00 10 T -1 2 T -1 2 [ ij ] = (X X) (X X) S = . . k0
En donde

01 . . 0k 11 . . 1k . . . . . . . . k1 . . kk

X es la matriz de diseo del modelo de regresin lineal mltiple

Las varianzas y covarianzas de los estimadores se definen de la siguiente forma:   2 V[ i ] =  = ii , i = 0, 1, ..., k (Varianza de i ) i

Cov[ i , j ] =

 


i

=
j

ij

i = 0, 1, ..., k

(Covarianza de

  i , j )

Matriz de varianzas y covarianzas para el ejemplo


02880 48.974 (X X) S = 0.2880 4.760x103 4 0.3927 3.366x10
T 1 2

0.3927

i,j = (X X)
T

1 2

3.360x10 (32.861) 5.458x103

1609.33 9.4653 12.904 = 9.4653 0.15654 0.01106 12.904 0.01106 0.17937 Varianza de los estimadores de mnimos cuadrados para el ejemplo  2  = , i = 0, 1, 2 V[ i ] = ii i
 = 00 = 1609.33 V[ 0 ] = 0 2  = 11 = 0.15654 V[ 1 ] = 1 2  = 22 = 0.17937 V[ 2 ] = 2 2

  

295

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

12.10 INFERENCIAS CON EL MODELO DE REGRESIN LINEAL


El modelo terico probabilista propuesto es: Y = 0 + 1 x1 + 2 x2 + ... + k xk

+ ,

N(0, 2)

El modelo obtenido con el mtodo de mnimos cuadrados es:

     y = 0 + 1 x 1 + 2 x 2 + ... + k x k

Del cual se obtienen los estimadores

   0 , 1 , ..., k para los parmetros 0 , 1 , ..., k

Los estimadores son variables aleatorias pues dependen de valores aleatorios observados y. Si los componentes son insesgados

i del error son independientes, puede demostrarse que los estimadores

E[i ] = i, i = 0, 1, ..., k  Cada estimador i tiene distribucin normal  2 i = 0, 1, ..., k i N(i,  ),


i

12.10.1 ESTADSTICOS PARA ESTIMACIN DE PARMETROS


Se establecen los estadsticos para realizar inferencias

Definicin: Estadsticos para estimacin de los parmetros 0 , 1 , ..., k

 i i
2 
i

, tienen distribucin t con = n k 1 grados de libertad

i = 0, 1, ..., k 12.10.2 INTERVALO DE CONFIANZA


Parmetro: Estimador: El estadstico

i , i = 0, 1, ..., k

 i , i = 0, 1, ..., k

t =

 i i
2 
i

, tiene distribucin t con = n k 1 grados de libertad

i = 0, 1, ..., k
Como es usual, la desigualdad

t/2 t t/2 tiene probabilidad 1 . De donde se obtiene

Definicin: Intervalo de confianza para

con nivel 1 -
2 

 i - t/2

 2  i i + t/2
i

, i=0, 1, ..., k

296

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Intervalo de confianza para 0 con nivel 95% para el ejemplo 1 - = 0.95, = nk1 = 621 = 3 t/2 = t0.025 = 3.182 (Tabla T)

 0 t/2

2  0 0 + t/2
0

2 

-134.071 3.188 1609.33 0 -134.071 + 3.188 1609.33 261.72 0 6.4204

12.10.3 PRUEBA DE HIPTESIS


Parmetro: Estimador: 1) 2) 3) 4)

i , i = 0, 1, ..., k

 i , i = 0, 1, ..., k

Ho: Ha:

i = b0 (Algn valor especificado para el parmetro i) i < b0 i > b0 i b0


 i b0
2 
i

nivel de significancia de la prueba Estadstico de prueba

t=

, tiene distribucin t con = n k 1 grados de libertad

i = 0, 1, ..., k Si se especifica el nivel de significancia se define la regin de rechazo de H0 Ha: i < b0 t < -t Ha: i > b0 t > t Ha: i b0 t<-t/2 t > t/2

Es importante probar la hiptesis Ho: i = 0 individualmente con cada parmetro i. En caso de que se pueda rechazar Ho, se puede concluir que la variable contribuye significativamente a la respuesta. Caso contrario, la variable es redundante y puede eliminarse del modelo.

Prueba con 5% de significancia que 2 0. (En el ejemplo se prueba si la variable X2, porcentaje de asistencia, contribuye significativamente al modelo) Ho: 2 = 0 Ha: 2 0 = 0.05 = n k 1 = 3, t/2 = t0.025 = 3.182 (Tabla T)
Regin de rechazo de Ho:

t < 3.182 o t > 3.182

Clculo del estadstico de prueba

t=

 2 0
2 
2

1.4437 0 0.17937

= 3.4088 ,

t cae en la regin de rechazo

Decisin: Se rechaza Ho el aporte de X2 al modelo si es significativo

297

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

12.11 PRUEBA DE LA NORMALIDAD DEL ERROR


Se puede usar la prueba K-S para probar la suposicin de normalidad de los errores

Prueba de Kolmogorov-Smirnov con 5% de significancia para la normalidad del error con los datos del ejemplo Ho: N(0, ) Ha: Ho = 0.05
2

(Distribucin normal con media 0 y varianza 2)

Estadstico de prueba Dn = max| Sn(xi)

F0(xi)|

(Para este ejemplo xi son los valores ei)


(Tabla K-S)

Regin de rechazo de Ho = 0.05, n = 6 D0.05 = 0.521 Rechazar H0 si Dn > 0.521  i ei = yi - yi , i = 1, 2, .., 6

 y = 134.07 + 1.4888 x1 + 1.4437x 2 (Modelo de mnimos cuadrados obtenido)  = -134.07 + 14888(67) + 1.4437(75) = 73.9571 x1 = 67, x2 = 75 y 1  e1 = y1 - y1 = 80 73.9571 = 6.0429, etc.

e1 6.0429 e 1.6866 2 e3 2.1121 = e4 5.0878 e5 4.0562 3.5294 e6

e N(0, 2) e 0 F0(xi) = F0(ei) = P(Z< i ) 2 S2 = 32.861 S = 5.7325


Modelo propuesto

(Aproximadamente) Distribucin normal estndar acumulada

5.0878 0 ) = 0.1874, 5.7325 Tabulacin de resultados con la notacin xi = ei

F0(x1) = F0(-5.0878) = P(Z< i 1 2 3 4 5 6 xi (ordenados)


-5.0878 -4.0562 -2.1121 1.6866 3.5294 6.0401

etc

(Datos e ordenados)

Sn(xi)
1/6 = 0.1666 2/6 = 0.3333 3/6 = 0.5 4/6 = 0.6666 5/6 = 0.8333 6/6 = 1

F0(xi)
0.1874 0.2396 0.3563 0.6157 0.7310 0.8540

|Sn(xi)- F0(xi)|
0.0207 0.0937 0.1437 0.0510 0.1023 0.1460

Dn = max| Sn(xi) F0(xi)| = 0.1460


Conclusin:

Dn no cae en la regin de rechazo, por lo tanto no se puede rechazar Ho

298

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

EJERCICIO
Se realiz un estudio del desgaste de un rodamiento (Y), y su relacin con la viscosidad del aceite (X1) y la carga que soporta (X2), obtenindose los siguientes datos, en las unidades que correspondan: X1 X2 Y 1.6 8.51 19.3 15.5 8.16 23.0 22.0 10.58 17.2 43.0 12.01 91.0 Analice el modelo de regresin lineal mltiple propuesto:

Y = 0 + 1 x1 + 2 x2 + ,

i N(0, 2)

a) Dibuje un diagrama de dispersin Y vs. X1 y Y vs. X2 b) Escriba la matriz de diseo y con ella escriba el modelo propuesto en notacin matricial c) Use el modelo de mnimos cuadrados para encontrar los estimadores del modelo propuesto. Use la matriz de diseo en sus clculos d) Use el modelo para pronosticar el desgaste cuando la viscosidad sea 25 y la carga 10.0 e) Calcule SCT, SCR, SCE y escriba la Tabla ANOVA f) Pruebe con 5% de significancia la dependencia lineal del modelo propuesto g) Encuentre el coeficiente de determinacin e interprete su significado. h) Calcule una estimacin de la variancia i) Encuentre la matriz de variancia-covariancia j) Calcule la varianza de los estimadores del modelo de mnimos cuadrados k) Encuentre un intervalo de confianza de 95% para cada parmetro l) Pruebe con 5% de significancia si el aporte de cada variable X1, X2 al modelo es significativo m) Pruebe la normalidad del error con 5% de significancia mediante la prueba de Kolmogorov-Smirnov

299

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

MATLAB
Regresin lineal mltiple usando notacin matricial
>> x=[1 67 75; 1 65 78; 1 78 79; 1 60 83; 1 64 65; 1 61 76] x= 1 67 75 1 65 78 1 78 79 1 60 83 1 64 65 1 61 76 >> y=[ 80; 77; 94; 70; 51; 70] y= 80 77 94 70 51 70 >> [b, bint, e, eint, stats] = regress(y, x, 0.05) b= -134.0719 1.4888 1.4437 bint = -261.7405 -6.4034 0.2297 2.7480 0.0959 2.7916 e= 6.0401 1.6866 -2.1121 -5.0878 -4.0562 3.5294 stats = 0.9019 13.7968
Matriz de diseo X

Vector de observaciones

Regresin lineal simple

= 0.05

Coeficientes 0 , 1 , 2 del modelo de mnimos cuadrados Intervalos de confianza para 0 , 1 , 2

Vector de residuales

0.0307

Coeficiente de determinacin R2, valor del estadstico F, valor p de la prueba F

Uso del modelo de mnimos cuadrados


>> yp=b(1)+b(2)*75+b(3)*80 yp = 93.0893
Evaluar el modelo con x1 = 75, x2 = 80

Matriz de correlacin lineal de los datos de la muestra


>> cx1y =corrcoef(x(:,2),y) cx1y = 1.0000 0.7226 0.7226 1.0000 >> cx2y=corrcoef(x(:,3),y) cx2y = 1.0000 0.6626 0.6626 1.0000
Correlacin lineal entre x1 y y

r = 0.7226

(correlacin positiva dbil)

Correlacin lineal entre x2 y y

r = 0.6626

(correlacin positiva dbil)

300

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

Grficos de dispersin recta de regresin


>> clf >> scatter(x(:,2),y,'b','filled'),grid on >> scatter(x(:,3),y,'k','filled'),grid on
Grfico de dispersin x1 y y Grfico de dispersin x1 y y

Prueba de la normalidad del error de los residuales


>> sce =sum(e.^2) sce = 98.5830 >> s2 =sce/3 s2 = 32.8610 >> t=sort(e); >> f=normcdf(t, 0, sqrt(s2)); >> [h,p,ksstat,vc]=kstest(t,[t f ], 0.05,0) h= 0 p= 0.9700 ksstat = 0.1874 vc = 0.5193
Suma de los cuadrados de residuales Estimacin de la varianza S2

Residuales ordenados Modelo a probar ei Prueba K-S, = 0.05

N(0, 2)r

No se puede rechazar el modelo Valor p de la prueba Valor del estadstico de prueba Valor crtico de la regin de rechazo

Matriz de varianzas y covarianzas de los estimadores i


>> format long Para visualizar con mayor precisin >> mvc = inv(x' *x)*s2 MVC Usando notacin matricial La diagonal contiene los valores V(i) mvc = 1.0e+003 * 1.60933261666704 -0.00946526866468 -0.01290428413874 V(0) = 1609.3 -0.00946526866468 0.00015654447216 -0.00001106020727 V(1) = 0.1565 V(2) = 0.1793 -0.01290428413874 -0.00001106020727 0.00017937387435

301

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

ALFABETO GRIEGO
alfa beta gama delta psilon zeta eta theta iota kappa lambda mu nu xi micron pi rho sigma tau upsilon fi ji psi omega

302

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

DISTRIBUCIN NORMAL ESTNDAR PROBABILIDAD ACUMULADA F(Z), Z 0

z
-3.5 -3.4 -3.3 -3.2 -3.1 -3.0 -2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 -2.2 -2.1 -2.0 -1.9 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 -1.2 -1.1 -1.0 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 -0.0

0.09

0.08

0.07

0.06

0.05

0.04

0.03

0.02

0.01

0.00

0.000165 0.000172 0.000179 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337 0.000350 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000467 0.000483 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350 0.001395 0.001441 0.001489 0.001538 0.001589 0.001641 0.001695 0.001750 0.001807 0.001866 0.001926 0.001988 0.002052 0.002118 0.002186 0.002256 0.002327 0.002401 0.002477 0.002555 0.002635 0.002718 0.002803 0.002890 0.002980 0.003072 0.003167 0.003264 0.003364 0.003467 0.003573 0.003681 0.003793 0.003907 0.004025 0.004145 0.004269 0.004396 0.004527 0.004661 0.004799 0.004940 0.005085 0.005234 0.005386 0.005543 0.005703 0.005868 0.006037 0.006210 0.006387 0.006569 0.006756 0.006947 0.007143 0.007344 0.007549 0.007760 0.007976 0.008198 0.008424 0.008656 0.008894 0.009137 0.009387 0.009642 0.009903 0.010170 0.010444 0.010724 0.011011 0.011304 0.011604 0.011911 0.012224 0.012545 0.012874 0.013209 0.013553 0.013903 0.014262 0.014629 0.015003 0.015386 0.015778 0.016177 0.016586 0.017003 0.017429 0.017864 0.018309 0.018763 0.019226 0.019699 0.020182 0.020675 0.021178 0.021692 0.022216 0.022750 0.023295 0.023852 0.024419 0.024998 0.025588 0.026190 0.026803 0.027429 0.028067 0.028717 0.029379 0.030054 0.030742 0.031443 0.032157 0.032884 0.033625 0.034379 0.035148 0.035930 0.036727 0.037538 0.038364 0.039204 0.040059 0.040929 0.041815 0.042716 0.043633 0.044565 0.045514 0.046479 0.047460 0.048457 0.049471 0.050503 0.051551 0.052616 0.053699 0.054799 0.055917 0.057053 0.058208 0.059380 0.060571 0.061780 0.063008 0.064256 0.065522 0.066807 0.068112 0.069437 0.070781 0.072145 0.073529 0.074934 0.076359 0.077804 0.079270 0.080757 0.082264 0.083793 0.085343 0.086915 0.088508 0.090123 0.091759 0.093418 0.095098 0.096801 0.098525 0.100273 0.102042 0.103835 0.105650 0.107488 0.109349 0.111233 0.113140 0.115070 0.117023 0.119000 0.121001 0.123024 0.125072 0.127143 0.129238 0.131357 0.133500 0.135666 0.137857 0.140071 0.142310 0.144572 0.146859 0.149170 0.151505 0.153864 0.156248 0.158655 0.161087 0.163543 0.166023 0.168528 0.171056 0.173609 0.176185 0.178786 0.181411 0.184060 0.186733 0.189430 0.192150 0.194894 0.197662 0.200454 0.203269 0.206108 0.208970 0.211855 0.214764 0.217695 0.220650 0.223627 0.226627 0.229650 0.232695 0.235762 0.238852 0.241964 0.245097 0.248252 0.251429 0.254627 0.257846 0.261086 0.264347 0.267629 0.270931 0.274253 0.277595 0.280957 0.284339 0.287740 0.291160 0.294599 0.298056 0.301532 0.305026 0.308538 0.312067 0.315614 0.319178 0.322758 0.326355 0.329969 0.333598 0.337243 0.340903 0.344578 0.348268 0.351973 0.355691 0.359424 0.363169 0.366928 0.370700 0.374484 0.378281 0.382089 0.385908 0.389739 0.393580 0.397432 0.401294 0.405165 0.409046 0.412936 0.416834 0.420740 0.424655 0.428576 0.432505 0.436441 0.440382 0.444330 0.448283 0.452242 0.456205 0.460172 0.464144 0.468119 0.472097 0.476078 0.480061 0.484047 0.488033 0.492022 0.496011 0.500000

303

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

DISTRIBUCIN NORMAL ESTNDAR PROBABILIDAD ACUMULADA F(Z), Z 0

z
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.500000 0.503989 0.507978 0.511967 0.515953 0.519939 0.532922 0.527903 0.531881 0.535856 0.539828 0.543795 0.547758 0.551717 0.555760 0.559618 0.563559 0.567495 0.571424 0.575345 0.579260 0.583166 0.587064 0.590954 0.594835 0.598706 0.602568 0.606420 0.610261 0.614092 0.617911 0.621719 0.625516 0.629300 0.633072 0.636831 0.640576 0.644309 0.648027 0.651732 0.655422 0.659097 0.662757 0.666402 0.670031 0.673645 0.677242 0.680822 0.684386 0.687933 0.691462 0.694974 0.698468 0.701944 0.705401 0.708840 0.712260 0.715661 0.719043 0.722405 0.725747 0.729069 0.732371 0.735653 0.738914 0.742154 0.745373 0.748571 0.751748 0.754903 0.758036 0.761148 0.764238 0.767305 0.770350 0.773373 0.776373 0.779350 0.782305 0.785236 0.788145 0.791030 0.793892 0.796731 0.799546 0.802338 0.805106 0.807850 0.810570 0.813267 0.815940 0.818589 0.821214 0.823815 0.826391 0.828944 0.831472 0.833977 0.836457 0.838913 0.841345 0.843752 0.846136 0.848495 0.850830 0.853141 0.855428 0.857690 0.859929 0.862143 0.864334 0.866500 0.868643 0.870762 0.872857 0.874928 0.876976 0.878999 0.881000 0.882977 0.884930 0.886860 0.888767 0.890651 0.892512 0.894350 0.896165 0.897958 0.899727 0.901475 0.903199 0.904902 0.906582 0.908241 0.909877 0.911492 0.913085 0.914657 0.916207 0.917736 0.919243 0.920730 0.922196 0.923641 0.925066 0.926471 0.927855 0.929219 0.930563 0.931888 0.933193 0.934478 0.935744 0.936992 0.938220 0.939429 0.940620 0.941792 0.942947 0.944083 0.945201 0.946301 0.947384 0.948449 0.949497 0.950529 0.951543 0.952540 0.953521 0.954486 0.955435 0.956367 0.957284 0.958185 0.959071 0.959941 0.960796 0.961636 0.962462 0.963273 0.964070 0.964852 0.965621 0.966375 0.967116 0.967843 0.968557 0.969258 0.969946 0.970621 0.971283 0.971933 0.972571 0.973197 0.973810 0.974412 0.975002 0.975581 0.976148 0.976705 0.977250 0.977784 0.978308 0.978822 0.979325 0.979818 0.980301 0.980774 0.981237 0.981691 0.982136 0.982571 0.982997 0.983414 0.983823 0.984222 0.984614 0.984997 0.985371 0.985738 0.986097 0.986447 0.986791 0.987126 0.987455 0.987776 0.988089 0.988396 0.988696 0.988989 0.989276 0.989556 0.989830 0.990097 0.990358 0.990613 0.990863 0.991106 0.991344 0.991576 0.991802 0.992024 0.992240 0.992451 0.992656 0.992857 0.993053 0.993244 0.993431 0.993613 0.993790 0.993963 0.994132 0.994297 0.994457 0.994614 0.994766 0.994915 0.995060 0.995201 0.995339 0.995473 0.995604 0.995731 0.995855 0.995975 0.996093 0.996207 0.996319 0.996427 0.996533 0.996636 0.996736 0.996833 0.996928 0.997020 0.997110 0.997197 0.997282 0.997365 0.997445 0.997523 0.997599 0.997673 0.997744 0.997814 0.997882 0.997948 0.998012 0.998074 0.998134 0.998193 0.998250 0.998305 0.998359 0.998411 0.998462 0.998511 0.998559 0.998605 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499 0.999517 0.999533 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999650 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999821 0.999828 0.999835

304

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

TABLA DE LA DISTRIBUCIN T

t P(T t) =
.40 .25
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 .325 1.000 .289 .816 .277 .765 .271 .741 .267 .727 .265 .718 .263 .711 .262 .706 .261 .703 .260 .700 .260 .697 .259 .695 .259 .694 .258 .692 .258 .691 .258 .690 .257 .689 .257 .688 .257 .688 .257 .687 .257 .686 .256 .686 .256 .685 .256 .685 .256 .684 .256 .684 .256 .684 .256 .683 .256 .683 .256 .683 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.310 6.314 12.706 31.821 63.657 127.320 318.310 636.620 2.920 4.303 6.965 9.925 14.089 23.326 31.598 2.353 3.182 4.541 5.841 7.453 10.213 12.924 2.132 2.776 3.747 4.604 5.598 7.173 8.610 2.015 2.571 3.365 4.032 4.773 5.893 6.869 1.943 2.447 3.143 3.707 4.317 5.208 5.959 1.895 2.365 2.998 3.499 4.029 4.785 5.408 1.860 2.306 2.896 3.355 3.833 4.501 5.041 1.833 2.262 2.821 3.250 3.690 4.297 4.781 1.812 2.228 2.764 3.169 3.581 4.144 4.587 1.796 2.201 2.718 3.106 3.497 4.025 4.437 1.782 2.179 2.681 3.055 3.428 3.930 4.318 1.771 2.160 2.650 3.012 3.372 3.852 4.221 1.761 2.145 2.624 2.977 3.326 3.787 4.140 1.753 2.131 2.602 2.947 3.286 3.733 4.073 1.746 2.120 2.583 2.921 3.252 3.686 4.015 1.740 2.110 2.567 2.898 3.222 3.646 3.965 1.734 2.101 2.552 2.878 3.197 3.610 3.922 1.729 2.093 2.539 2.861 3.174 3.579 3.883 1.725 2.086 2.528 2.845 3.153 3.552 3.850 1.721 2.080 2.518 2.831 3.135 3.527 3.819 1.717 2.074 2.508 2.819 3.119 3.505 3.792 1.714 2.069 2.500 2.807 3.104 3.485 3.767 1.711 2.064 2.492 2.797 3.091 3.467 3.745 1.708 2.060 2.485 2.787 3.078 3.450 3.725 1.706 2.056 2.479 2.779 3.067 3.435 3.707 1.703 2.052 2.473 2.771 3.057 3.421 3.690 1.701 2.048 2.467 2.763 3.047 3.408 3.674 1.699 2.045 2.462 2.756 3.038 3.396 3.659 1.697 2.042 2.457 2.750 3.030 3.385 3.646 2.807 3.090 3.291 .10 .05 .025 .01 .005 .0025 .001 .0005

.253 .674 1.282 1.645 1.960 2.326 2.576

305

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

TABLA DE LA DISTRIBUCIN JI-CUADRADO

2 2 P( ) =


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100

.995

.990

.975

.950

.900

.500

.100

.050

.025

.010

.005

.00003 .0001 .0009 .0039 .02 .01 .02 .05 .10 .21 .07 .11 .22 .35 .58 .21 .30 .48 .71 1.06 .41 .55 .83 1.15 1.61 .68 .87 .24 1.64 2.20 .99 .24 .69 2.17 2.83 1.34 1.65 2.18 2.73 3.49 1.73 2.09 2.70 3.33 4.17 2.16 2.56 3.25 3.94 4.87 2.60 3.05 3.82 4.57 5.58 3.07 3.57 4.40 5.23 6.30 3.57 4.11 5.01 5.89 7.04 4.07 4.66 5.63 6.57 7.79 4.60 5.23 6.27 7.26 8.55 5.14 5.81 6.91 7.96 9.31 5.70 6.41 7.56 8.67 10.09 6.26 7.01 8.23 9.39 10.87 6.84 7.63 8.91 10.12 11.65 7.43 8.26 9.59 10.85 12.44 8.03 8.90 10.28 11.59 13.24 8.64 9.54 10.98 12.34 14.04 9.26 10.20 11.69 13.09 14.85 9.89 10.86 12.40 13.85 15.66 10.52 11.52 13.12 14.61 16.47 11.16 12.20 13.84 15.38 17.29 11.81 12.88 14.57 16.15 18.11 12.46 13.57 15.31 16.93 18.94 13.12 14.26 16.05 17.71 19.77 13.79 14.95 16.79 18.49 20.60 20.71 22.16 24.43 26.51 29.05 27.99 29.71 32.36 34.76 37.69 35.53 37.48 40.48 43.19 46.46 43.28 45.44 48.76 51.74 55.33 51.17 53.54 57.15 60.39 64.28 59.20 61.75 65.65 69.13 73.29 67.33 70.06 74.22 77.93 82.36

.45 2.71 3.84 5.02 6.63 7.88 1.39 4.61 5.99 7.38 9.21 10.60 2.37 6.25 7.81 9.35 11.34 12.84 3.36 7.78 9.49 11.14 13.28 14.86 4.35 9.24 11.07 12.83 15.09 16.75 5.35 10.65 12.59 14.45 16.81 18.55 6.35 12.02 14.07 16.01 18.48 20.28 7.34 13.36 15.51 17.53 20.09 21.96 8.34 14.68 16.92 19.02 21.67 23.59 9.34 15.99 18.31 20.48 23.21 25.19 10.34 17.28 19.68 21.92 24.72 26.76 11.34 18.55 21.03 23.34 26.22 28.30 12.34 19.81 22.36 24.74 27.69 29.82 13.34 21.06 23.68 26.12 29.14 31.32 14.34 22.31 25.00 27.49 30.58 32.80 15.34 23.54 26.30 28.85 32.00 34.27 16.34 24.77 27.59 30.19 33.41 35.72 17.34 25.99 28.87 31.53 34.81 37.16 18.34 27.20 30.14 32.85 36.19 38.58 19.34 28.41 31.41 34.17 37.57 40.00 20.34 29.62 32.67 35.48 38.93 41.40 21.34 30.81 33.92 36.78 40.29 42.80 22.34 32.01 35.17 38.08 41.64 44.18 23.34 33.20 36.42 39.36 42.98 45.56 24.34 34.28 37.65 40.65 44.31 46.93 25.34 35.56 38.89 41.92 45.64 48.29 26.34 36.74 40.11 43.19 46.96 49.65 27.34 37.92 41.34 44.46 48.28 50.99 28.34 39.09 42.56 45.72 49.59 52.34 29.34 40.26 43.77 46.98 50.89 53.67 39.34 51.81 55.76 59.34 63.69 66.77 49.33 63.17 67.50 71.42 76.15 79.49 59.33 74.40 79.08 83.30 88.38 91.95 69.33 85.53 90.53 95.02 100.42 104.22 79.33 96.58 101.88 106.63 112.33 116.32 89.33 107.57 113.14 118.14 124.12 128.30 99.33 118.50 124.34 129.56 135.81 140.17

306

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

TABLA DE LA DISTRIBUCIN F

F ,1 , 2 P(F > F ,1 , 2 ) =

= 0.05
12 15 20 24 30 40 60 120

1
1 2 3 4 5 6 7 8 9 10

1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.9 245.9 248.0 249.1 250.1 251.1 252.2 253.3 254.3 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.50 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.36 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23

8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07 16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01 17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96 18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92 19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84 21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81 22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78 23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73 25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71 26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69 27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.06 1.97 1.93 1.88 1.84 1.79 1.73 1.67 28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65 29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64 30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62 40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51 60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39 120 3.92 3.07 2.68 2.45 2.29 2.17 2.09 2.02 1.96 1.91 1.83 1.75 1.66 1.61 1.55 1.55 1.43 1.35 1.25 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00

307

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

TABLA PARA LA PRUEBA KOLMOGOROV-SMIRNOV (K-S) : n:


Nivel de significancia Tamao de la muestra Valores crticos

D, n
0.05 0.875 0.842 0.708 0.624 0.565 0.521 0.486 0.457 0.432 0.410 0.391 0.375 0.361 0.349 0.338 0.328 0.318 0.309 0.301 0.294 0.270 0.240 0.230 1.36 0.01 0.995 0.929 0.828 0.733 0.669 0.618 0.577 0.543 0.514 0.490 0.468 0.450 0.433 0.418 0.404 0.392 0.381 0.371 0.363 0.356 0.320 0.290 0.270 1.63

n
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 Mayor a 35

0.20 0.900 0.684 0.565 0.494 0.446 0.410 0.381 0.358 0.339 0.322 0.307 0.295 0.284 0.274 0.266 0.258 0.250 0.244 0.237 0.231 0.210 0.190 0.180 1.07

0.15 0.925 0.726 0.597 0.525 0.474 0.436 0.405 0.381 0.360 0.342 0.326 0.313 0.302 0.292 0.283 0.274 0.266 0.259 0.252 0.246 0.220 0.200 0.190 1.14

0.10 0.950 0.776 0.642 0.564 0.510 0.470 0.438 0.411 0.388 0.368 0.352 0.338 0.325 0.314 0.304 0.295 0.286 0.278 0.272 0.264 0.240 0.220 0.201 1.22

308

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

DISTTOOL
Instrumento computacional grfico interactivo disponible en MATLAB para entender visualmente algunas propiedades de las distribuciones de probabilidad ms importantes. DISTTOOL crea interactivamente el grfico de la distribucin de probabilidad, o densidad de probabilidad, y la distribucin acumulada para los siguientes modelos:

Beta Uniforme discreta Gamma Binomial Negativa Ji-cuadrado no centrada Rayleigh Weibull

Binomial Exponencial Geomtrica F no centrada Normal T

Ji-cuadrado F Lognormal T no centrada Poisson Uniforme continua

Se pueden cambiar los parmetros escribiendo sus valores o moviendo un cursor sobre el grfico o barras de desplazamiento. Se pueden obtener valores de la distribucin o de probabilidad moviendo una lnea de referencia sobre el grfico Para activar este utilitario digite disttool en la ventana de comandos de MATLAB

Elegir el modelo de probabilidad

Cursor

Elegir funcin de distribucin (o densidad) PDF o distribucin acumulada CDF

Distribucin (o densidad) Valor de probabilidad o densidad Valor de la variable aleatoria

Barra

Parmetro

Parmetro

309

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

RANDTOOL
Instrumento computacional grfico interactivo disponible en MATLAB para obtener muestras aleatorias de las distribuciones de probabilidad ms importantes. RANDTOOL crea un histograma con los datos de las muestras aleatorias generadas para los siguientes modelos.

Beta Uniforme discreta Gamma Binomial Negativa Ji-cuadrado no centrada Rayleigh Weibull

Binomial Exponencial Geomtrica F no centrada Normal T

Ji-cuadrado F Lognormal T no centrada Poisson Uniforme continua

Se pueden cambiar los parmetros escribiendo sus valores o moviendo barras de desplazamiento. Se puede especificar el tamao de la muestra y se puede almacenar la muestra escribiendo una variable para ser usada desde la ventana de comandos de MATLAB. Para activar este utilitario digite randtool Elegir el modelo de probabilidad en la ventana de comandos de MATLAB

Tamao de la muestra

Histograma Generar muestra

Barra

Almacenar muestra

Parmetro

Parmetro

310

Ing. Luis Rodrguez Ojeda, MSc.

PROBABILIDAD Y ESTADSTICA BSICA PARA INGENIEROS

ICM ESPOL

BIBLIOGRAFA
ESTADSTICA
Canavos, G. C. Probabilidad y Estadstica Aplicaciones y Mtodos, Mxico: McGraw-Hill Interamericana de Mxico, S. A. Castro A. B. Probabilidades y Estadstica Bsicas, Quito: Escuela Politcnica Nacional Freund, J. E. y Walpole R. E. Estadstica Matemtica con Aplicaciones, 4a. ed. Mxico: PrenticeHall Hispanoamericana, S. A. Hines, W. W. y Montgomery D. C. Probabilidad y Estadstica para Ingeniera, 3a. ed. Mxico: Compaia Editorial Continental Mendenhall W. Introduction to Probability and Statistics, 3d. ed. California: Duxbury Press Miller, I. R., Freund J. E. y Johnson R. Probabilidad y Estadstica para Ingenieros 4a. ed. Mxico: Prentice-Hall Hispanoamericana, S. A. Montgomery D. C. y Runger G. C. Probabilidad y Estadstica Aplicadas a la Ingeniera, 2a. ed. Mxico: Editorial Limusa S. A. Walpole, R. E. y Myers, R. H. Probabilidad y Estadstica para Ingenieros, 3a. ed. Mxico: McGraw-Hill Interamericana de Mxico, S. A.

COMPUTACIN
The MathWorks, Inc. Statistics Toolbox for use with MATLAB User`s Guide, version 4 The MathWorks, Inc. Using MATLAB Computation, Visualization, Programming, version 6 Prez Lpez C. MATLAB y sus Aplicaciones en las Ciencias y la Ingeniera, Madrid: Pearson Educacin, S. A. Rodrguez Ojeda L. MATLAB Conceptos Bsicos y Programacin, tutorial, ICM ESPOL

311

Ing. Luis Rodrguez Ojeda, MSc.