Sei sulla pagina 1di 300

Universidad de Granada

DepartamentodeEstadsticaeInvestigacinOperativa

CONFIABILIDAD: FIABILIDAD Y MANTENIBILIDAD


Anlisis Paramtrico y no Paramtrico en R

Trabajo Fin de Mster Universitario


en Estadstica Aplicada

Silverio Navarrete Muela

Tutor: Dr. D. Rafael Prez Ocn

Granada, Septiembre de 2014


Trabajo Fin de Mster

CONFIABILIDAD: FIABILIDAD Y MANTENIBILIDAD


Anlisis Paramtrico y no Paramtrico en R

V B
El Tutor

Fdo.:SilverioNavarreteMuela Fdo.:Dr.D.RafaelPrezOcn

Granada, Septiembre de 2014


A la memoria de las personas que ya no
estn, pero siguen estando presentes
cada da.
A mi hermano Juan Manuel y mis padres Silverio y Adela

Resumen

En los ltimos aos se ha producido una revolucin en el uso de mtodos estadsticos para mejorar
la calidad de productos y servicios, apareciendo nuevas filosofas como TPM, Lean o la metodologa
Seis Sigma. Pero es, sin duda, el inters por la mejora de la calidad en funcin del tiempo, uno de los
eslabones en los que ms se est innovando. La confiabilidad de un producto es un trmino colectivo
que se usa para describir la disponibilidad de un producto y sus factores de influencia, esto es,
fiabilidad, mantenibilidad y logstica de mantenimiento. Para evaluar los valores obtenidos de las
caractersticas de confiabilidad es necesario empleo de mtodos estadsticos.
Este TFM presenta un estudio terico-prctico sobre fiabilidad y mantenibilidad basndose para
ello en el desarrollo de funciones en R (software de libre uso), Siendo ste un lenguaje y entorno de
programacin orientado a objetos para anlisis estadstico y grfico.
Se ha realizado una introduccin al proceso de anlisis de observaciones de tiempos hasta el fallo
MTTF y tiempos de reparacin MTTR mediante mtodos grficos, no paramtricos y paramtricos,
obteniendo la distribucin terica optima en cada caso , con comparativas de los mtodos de clculo
de los parmetros obtenidos y realizndose anlisis de inferencia estadstica. Finalmente, se ha
validado el modelo terico mediante generacin y ajuste de variables aleatorias de la distribucin
seleccionada en cada caso.

R.1

R.2
TabladeContenido

Tabla de Contenido

Resumen....................................................................................................................................1
Tabla de Contenido...................................................................................................................1
Listado de Figuras.....................................................................................................................1
Listado de Tablas......................................................................................................................1
Captulo I. Introduccin............................................................................................................1
1.1 Antecedentes .......................................................................................................... 2
1.2 Objetivos de la Investigacin ................................................................................... 3
1.3 Estructura del TFM .................................................................................................. 4
Captulo II. Fundamentos Tericos...........................................................................................1
2.1 Introduccin ............................................................................................................ 2
2.2. Conceptos Fundamentales...................................................................................... 4
2.2.1. Confiabilidad...........................................................................................................4
2.2.1.1. Coste del Ciclo de Vida .................................................................................................. 5
2.2.1.2. Costes Relativos a la Confiabilidad ................................................................................ 6
2.2.2. Disponibilidad..........................................................................................................7
2.2.3. Fiabilidad.................................................................................................................8
2.2.3.1. Fiabilidad en Funcin del Tiempo ................................................................................. 8
2.2.3.2. Medidas de Fiabilidad ................................................................................................... 8
2.2.3.3. Distribuciones Estadsticas .......................................................................................... 14
2.2.3.3.1.DistribucinNormal ............................................................................................. 14
2.2.3.3.2.DistribucinLog-Normal ...................................................................................... 18
2.2.3.3.3.DistribucinExponencial ...................................................................................... 21
2.2.3.3.4.DistribucinWeibull ............................................................................................. 24
2.2.3.3.5.DistribucindeGamma ........................................................................................ 29
2.2.3.3.6.DistribucinErlang ............................................................................................... 32
2.2.4. Mantenibilidad......................................................................................................35
2.2.5. Soporte de Mantenimiento...................................................................................37
2.3. Mtodos Estadsticos de Estimacin de la Fiabilidad y el Mantenimiento. ............. 37
2.3.1. Caractersticas de los Datos..................................................................................39
2.3.1.1. Censura........................................................................................................................ 39
2.3.1.1.1.CensuraporlaDerecha ........................................................................................ 40
2.3.1.1.1.1.CensuraTipoI ................................................................................................ 40
2.3.1.1.1.2.CensuraTipoII ............................................................................................... 43
2.3.1.1.1.3.CensuraTipoIIIoAleatoria ........................................................................... 44

C.1
TabladeContenido

2.3.1.1.2.CensuraporlaIzquierda....................................................................................... 45
2.3.1.1.3.CensuraporIntervalo ........................................................................................... 45
2.3.1.2. Truncamiento .............................................................................................................. 45
2.3.1.2.1.TruncamientoporlaIzquierda ............................................................................. 46
2.3.1.2.2.TruncamientoporlaDerecha ............................................................................... 46
2.3.2. Estimacin no Paramtrica...................................................................................46
2.3.2.1. Tablas de Vida ............................................................................................................. 47
2.3.2.2. Estimador de Kaplan-Meier (KM) de la Funcin de Fiabilidad. ................................... 50
2.3.2.2.1.IntervalodeConfianzaUsandolaTransformacinlog ........................................ 51
2.3.2.2.2.IntervalodeConfianzaUsandolaTransformacinlog-log .................................. 52
2.3.2.2.3.PropiedadesdelEstimadorKaplan-Meier ............................................................ 53
2.3.2.3. Estimador de Kaplan- Meier Ponderado (KMP) .......................................................... 53
2.3.2.4. Estimador Nelson-Aalen (NA) de la Funcin de Riesgo Acumulado ........................... 55
2.3.2.5. Estimadores de la Funcin de Fiabilidad para Datos Truncados a la Izquierda y
Censurados a la Derecha .......................................................................................................... 56
2.3.2.5.1.EstimadordeTurnbull .......................................................................................... 57
2.3.2.5.2.EstimadordeNelson-AalenExtendido(NAE) ....................................................... 57
2.3.2.6. Comparacin de Funciones de Fiabilidad.................................................................... 58
2.3.3. Estimacin Paramtrica........................................................................................60
2.3.3.1. Estimacin Grfica....................................................................................................... 60
2.3.3.1.1.EstimacinconDatosnoCensurados................................................................... 61
2.3.3.1.1.1.LinealizacindeunaDistribucin. ................................................................. 62
2.3.3.1.1.1.1. Linealizacin de la f.d. Asociada a una Distribucin Exponencial .......... 62
2.3.3.1.1.1.2. Linealizacin de la f.d. Asociada a una Distribucin Weibull ................. 62
2.3.3.1.1.2.ConstruccindePlantillasEspecialesparaGrficosdeProbabilidad ........... 63
2.3.3.1.1.3Estimacindelaf.d.Emprica. ....................................................................... 64
2.3.3.1.1.4.IdentificacinGraficadelaDistribucindeAjuste........................................ 66
2.3.3.1.2.EstimacinconDatosCensurados........................................................................ 66
2.3.3.1.2.1.ConstruccindelGrficodeRiesgo(HazardPlots). ...................................... 67
2.3.3.1.2.2.EstimacinEmpricadeRiesgoAcumuladoparaWeibull ............................. 67
2.3.3.2. Estimacin Puntual. ..................................................................................................... 69
2.3.3.2.1.EstimacinporMnimosCuadrados(LeastSquaresMethod(LSM)) ................... 69
2.3.3.2.1.1.EstimacindeParmetrosparalaDistribucinExponencial ........................ 70
2.3.3.2.1.2.EstimacindeParmetrosparalaDistribucinWeibull ............................... 70
2.3.3.2.2.EstimacinporMximaVerosimilitud(MaximumLikelihoodEstimator(MLE)) . 71
2.3.3.2.2.1.EstimacindeParmetrosenObservacionesCompletas ............................. 71

C.2
TabladeContenido

2.3.3.2.2.1 1. Estimacin de Parmetros para la Distribucin Exponencial ................. 72


2.3.3.2.2.1.2. Estimacin de Parmetros para la Distribucin Weibull........................ 73
2.3.3.2.2.2.EstimacindeParmetrosenObservacionesCensuradas ............................ 73
2.3.3.2.2.2 1. Estimacin de Parmetros para la Distribucin Exponencial ................. 74
2.3.3.2.2.2.2. Estimacin de Parmetros para la Distribucin Weibull........................ 75
2.3.3.2.3.EstimacinporMomentos(MethodofMoments(MOM)) .................................. 76
2.3.3.2.3.1.EstimacindeParmetrosenObservacionesCompletas ............................. 76
2.3.3.2.3.1.1. Estimacin de Parmetros para la Distribucin Exponencial................. 77
2.3.3.2.3.1.2. Estimacin de Parmetros para la Distribucin Weibull........................ 77
2.3.3.2.3.2.EstimacindeParmetrosenObservacionesCensuradas ............................ 78
2.3.3.2.3.2.1. Estimacin de Parmetros para la Distribucin Exponencial................. 78
2.3.3.2.3.2.2. Estimacin de Parmetros para la Distribucin Weibull........................ 79
2.3.3.3. Estimacin de parmetros por Intervalos de Confianza ............................................. 80
2.3.3.3.1.EstimacinGeneral............................................................................................... 80
2.3.3.3.1.1.EstimacindeIntervaloenObservacionesCompletas .................................. 80
2.3.3.3.1.2.EstimacindeIntervaloenObservacionesCensuradas ................................ 82
2.3.3.3.1.2 1. Estimacin de Intervalo para la Distribucin Exponencial con Censura
Tipo II ............................................................................................................................ 82
2.3.3.3.1.2 2. Estimacin de Intervalo para la Distribucin Exponencial con Censura
Tipo I ............................................................................................................................. 82
2.3.3.3.2.EstimacinporMximaVerosimilitud ................................................................. 82
2.3.3.3.3.EstimacinporMnimosCuadrados..................................................................... 85
2.3.4. Contraste de Hiptesis..........................................................................................85
2.3.4.1. Estadstico de Contraste.............................................................................................. 85
2.3.4.2. Tipos de Errores........................................................................................................... 86
2.3.4.3. Tipos de Contrastes ..................................................................................................... 86
2.3.4.4. Bondad de Ajuste ........................................................................................................ 87
2.3.4.4.1.MuestrasCategorizadas....................................................................................... 87
2.3.4.4.1.1.Test 2 dePearsonoChi-Cuadrado. ............................................................. 87
2.3.4.4.1.2.TestG(RazndeVerosimilitud) .................................................................... 88
2.3.4.4.2.MuestrasnoCategorizadas.................................................................................. 89
2.3.4.4.2.1.TestdeKolmogorov-Smirnov ........................................................................ 89
2.3.4.4.2.2.TestdeCramr-vonMisses ........................................................................... 89
2.3.4.4.2.3.TestdeAnderson-Darling .............................................................................. 90
2.3.4.4.2.4.TestdeNormalidaddeShapiro-Wilk............................................................. 90
2.3.4.4.2.5.CoeficientedeDeterminacinR2 ................................................................... 91

C.3
TabladeContenido

2.4. Fiabilidad en Sistemas .......................................................................................... 92


2.4.1. Sistemas Coherentes.............................................................................................92
2.4.1.1. Sistema en Serie .......................................................................................................... 93
2.4.1.2. Sistema en Paralelo ..................................................................................................... 93
2.4.1.3. Sistema Mixto.............................................................................................................. 94
2.4.2. Funcin de Fiabilidad............................................................................................94
2.4.2.2. Fiabilidad de un Sistema en Paralelo .......................................................................... 96
2.4.3. Redundancia..........................................................................................................97
2.4.4. Anlisis Mediante Arboles de Fallo......................................................................99
Captulo III. Metodologa Experimental...................................................................................1
3.1 Procedimiento Metodolgico .................................................................................. 2
Captulo IV. Resultados y Anlisis............................................................................................1
4.1. Aplicacin Prctica ................................................................................................. 2
4.1.1. Introduccin.............................................................................................................2
4.1.2. Caractersticas de los datos ................................................................................. 2
4.2. Anlisis Fiabilidad de tiempos de Operacin TTF ..................................................... 3
4.2.1. Anlisis Descriptivo.................................................................................................3
4.2.2. Anlisis No Paramtrico..........................................................................................5
4.2.2.1. Funcin de Supervivencia.............................................................................................. 6
4.2.2.2. .Funcin de Distribucin o de Probabilidad .................................................................. 9
4.2.2.3. Funcin de Riesgo Acumulado ...................................................................................... 9
4.2.2.4. Ajuste de Datos Tiempo-Evento (supervivencia) a Modelos Paramtricos ................ 11
4.2.2.4.1.FuncindeSupervivencia(Fiabilidad)S(T) ........................................................... 11
4.2.2.4.2.FuncindeRiesgo(Fallo)h(t) ............................................................................... 11
4.2.2.4.3.FuncindeRiesgo(Fallo)Acumulado................................................................... 12
4.2.2.5. Estimacin no Paramtrica ......................................................................................... 13
4.2.3. Anlisis Paramtrico.............................................................................................14
4.2.3.1. Estimacin Grafica ...................................................................................................... 14
4.2.3.2. Estimacin Grafica Paramtrica ................................................................................. 17
4.2.3.2. Estimacin Puntual ..................................................................................................... 20
4.2.3.2.1.EstimacinporMnimosCuadrados..................................................................... 21
4.2.3.2.2.EstimacinporMximaVerosimilitud ................................................................. 21
4.2.3.2.2.1.EstimacionesparaObservacionesCompletas ............................................... 21
4.2.3.2.2.2.EstimacionesparaObservacionesconCensura ............................................ 22
4.2.3.2.2.EstimacinporMomentos ................................................................................... 22

C.4
TabladeContenido

4.2.3.3. Estimacin de Parmetros por Intervalos. ................................................................ 22


4.2.3.3.1.EstimacinporMnimosCuadrados..................................................................... 23
4.2.3.3.2.EstimacinporMximaVerosimilitud ................................................................. 24
4.2.3.3.2.EstimacinporMomentos ................................................................................... 24
4.2.3.4. Comparacin de Mtodos de Estimacin de Parmetros......................................... 24
4.2.3.5. Bondad de Ajuste ....................................................................................................... 26
4.2.3.5.1.TestdeBondaddeAjusteparaMnimosCuadrados ........................................... 27
4.2.3.5.1.1.InterpretacindelosResultados ................................................................... 27
4.2.3.5.1.2.ANOVAyTestdeIndependenciaLineal......................................................... 28
4.2.3.5.1.2.1. Anlisis de Varianza del Modelo de Regresin Lineal ............................ 28
4.2.3.5.1.2.2. Test de Independencia Lineal y Correlacin Lineal ................................ 28
4.2.3.5.2.TestdelaBondadMedianteEstadsticos ............................................................. 28
4.2.3.6. Propiedades de Fiabilidad .......................................................................................... 30
4.2.3.6.1.FuncindeDensidadf(t)....................................................................................... 30
4.2.3.6.2.FuncindeDistribucinF(t).................................................................................. 31
4.2.3.6.3.FuncindeFiabilidadR(t)oSupervivenciaS(t). ................................................... 31
4.2.3.6.4.FuncindeRiesgooTasadeFalloh(t). ................................................................ 32
4.2.3.6.5.FuncindeRiesgoAcumuladoH(t). ..................................................................... 33
4.2.3.6.6.MediaoEsperanzaMatemtica=E[T]. ............................................................ 34
4.2.3.6.7.VarianzaVar[T]. ................................................................................................... 34
4.2.3.6.8.p-cuantil................................................................................................................ 34
4.2.4. Anlisis Comparativo no Paramtrico y Paramtrico..........................................35
4.2.4.1. Funcin de Distribucin F(t). ....................................................................................... 35
4.2.42. Funcin de Fiabilidad R(t) o Supervivencia S(t). ........................................................... 35
4.2.43. Funcin de Riesgo o Tasa de Fallo h(t). ........................................................................ 36
4.2.4.4. Funcin de Riesgo Acumulado H(t). ............................................................................ 36
4.3. Anlisis de Mantenimiento del Tiempo de Reparacin TTR.................................... 37
4.3.1. Anlisis Descriptivo...............................................................................................37
4.3.2. Anlisis Paramtrico.............................................................................................39
4.3.2.1. Estimacin Grafica ...................................................................................................... 39
4.3.2.2. Estimacin Grafica Paramtrica ................................................................................. 41
4.3.2.3. Estimacin Puntual ..................................................................................................... 44
4.3.2.3.1.EstimacinporMnimosCuadrados..................................................................... 44
4.3.2.3.2.EstimacinporMximaVerosimilitud ................................................................. 45
4.3.2.3.2.1.EstimacionesparaObservacionesCompletas ............................................... 45

C.5
TabladeContenido

4.3.2.3.2.2.EstimacionesparaObservacionesconCensura ............................................ 45
4.3.2.3.2.EstimacinporMomentos ................................................................................... 46
4.3.2.4. Estimacin de Parmetros por Intervalos. ................................................................ 46
4.3.2.4.1.EstimacinporMnimosCuadrados..................................................................... 46
4.3.2.4.2.EstimacinporMximaVerosimilitud ................................................................. 47
4.3.2.5. Comparacin de Mtodos de Estimacin de Parmetros......................................... 48
4.3.2.6. Bondad de Ajuste ....................................................................................................... 49
4.3.2.6.1.TestdeBondaddeajusteparaMnimosCuadrados ............................................ 49
4.3.2.6.1.1.Interpretacindelosresultados .................................................................... 49
4.3.2.6.1.2.ANOVAyTestdeindependencialineal ......................................................... 50
4.3.2.6.1.2.1. Anlisis de varianza del modelo de regresin lineal .............................. 50
4.3.2.6.1.2.2. Test de independencia lineal y correlacin lineal .................................. 51
4.3.2.6.2.TestdelaBondadMedianteEstadsticos ............................................................. 51
4.3.2.7. Propiedades del Mantenimiento ............................................................................... 53
4.3.2.6.1.FuncindeDensidaddeProbabilidaddeReparacinf(t) .................................... 53
4.3.2.7.2.FuncindeMantenibilidadM(t). .......................................................................... 53
4.3.2.7.3.FuncindenoReparabilidadRr(t). ....................................................................... 54
4.3.2.7.4.FuncindeTasadeReparacinh(t). .................................................................... 55
4.3.2.7.5.FuncindeTasadeReparacinAcumuladaH(t). ................................................ 55
4.3.2.7.6.MediaoEsperanzaMatemtica=E[T]. ............................................................ 56
4.3.2.7.7.VarianzaVar[T]. ................................................................................................... 56
4.3.2.7.8.p-cuantil................................................................................................................ 56
4.3.3. Anlisis No Paramtrico........................................................................................56
4.3.3.1. Funcin de no Reparabilidad....................................................................................... 57
4.3.3.2. .Funcin de Mantenibilidad M(t) ................................................................................ 60
4.3.3.3. Funcin Tasa de Reparacin Acumulada..................................................................... 60
4.3.3.4. Ajuste de Datos Tiempo-Evento (no Reparabilidad) a Modelos Paramtricos ........... 62
4.3.3.4.1.FuncindenoReparabilidad ................................................................................ 62
4.3.3.4.2.FuncindeTasadeReparacinh(t) ..................................................................... 63
4.3.3.4.3.FuncindeTasadeReparacinAcumulada......................................................... 63
4.3.3.5. Estimacin No Paramtrica ......................................................................................... 64
4.3.4. Anlisis Comparativo no Paramtrico y Paramtrico..........................................65
4.3.4.1. Funcin de Mantenibilidad M(t). ................................................................................ 66
4.3.4.2. Funcin de no Reparabilidad Rr(t). .............................................................................. 66
4.3.4.3. Funcin de Tasa de Reparacin h(t). ........................................................................... 66
4.3.4.4. Funcin de Tasa de Reparacin Acumulada H(t). ....................................................... 67

C.6
TabladeContenido

4.4. Anlisis Disponibilidad ......................................................................................... 67


4.5. Simulacin ........................................................................................................... 68
4.5.1. Introduccin...........................................................................................................68
4.5.2. Variables Aleatorias de una Distribucin Weibull...............................................68
4.5.2.1. Generacin de Variables Aleatorias de una Distribucin Weibull .............................. 68
4.5.2.2. Anlisis de Ajuste de Valores a la Distribucin Weibull. ............................................. 70
4.5.2.2.1.ResultadosGrficosdeSimulacinparaunaMuestraden=10 ......................... 70
4.5.2.2.2.ResultadosGrficosdeSimulacinparaunaMuestraden=20 ......................... 71
4.5.2.2.3.ResultadosGrficosdeSimulacinparaunaMuestraden=40 ......................... 72
4.5.2.2.4.ResumendelosTestdeMSEydelasPruebasdeBondaddeAjuste ................... 74
4.5.3. Variables Aleatorias de una Distribucin Log-Normal........................................75
4.5.3.1. Generacin de Variables Aleatorias de una Distribucin Log-Normal ........................ 75
4.5.3.2. Anlisis de Ajuste de Valores a la Distribucin Log-Normal........................................ 75
4.5.3.2.1.ResultadosGrficosdeSimulacinparaunaMuestraden=10 ......................... 75
4.5.3.2.2.ResultadosGrficosdeSimulacinparaunaMuestraden=20 ......................... 77
4.5.3.2.3.ResultadosGrficosdeSimulacinparaunaMuestraden=40 ......................... 78
4.5.3.2.4.ResumendelosTestdeMSEydelasPruebasdeBondaddeAjuste ................... 79
Captulo V. Conclusiones Finales y Lneas de Investigacin Futuras.......................................1
5.1 Conclusiones Finales ................................................................................................ 2
5.2 Lneas de Investigacin Futuras ............................................................................... 3
Captulo VI. Referencias Bibliogrficas....................................................................................1
Apndices..................................................................................................................................1
Apndice 1. Datos Utilizados ......................................................................................... 2
Apndice 2. Tablas del Estimador de Kaplan-Meier (KM) ................................................ 4
2.1. Fiabilidad - Tiempo hasta el Fallo...............................................................................4
2.2. Mantenimiento - Tiempo de no Reparabilidad..........................................................6
Apndice 3. Simulacin de Variables Aleatorias ............................................................. 8
3.1. Valores Numricos para la Distribucin Weibull.......................................................8
3.2. Valores Numricos para la Distribucin Log-Normal..............................................10
Apndice 4. Software de Estadstica Aplicada Desarrollado en R .................................. 12
4.1. Distribuciones Estadsticas.......................................................................................12
4.2. Fiabilidad...................................................................................................................26
4.3. Mantenimiento.........................................................................................................49
4.4. Simulacin.................................................................................................................70
4.4.1. Generacin de Variables Aleatorias de una Distribucin Weibull ................................ 70

C.7
TabladeContenido

4.4.2. Generacin de Variables Aleatorias de una Distribucin Log-Normal ......................... 74

C.8
ListadodeFiguras

Listado de Figuras

Figura 1. Relaciones de la Confiabilidad ................................................................................................. 4


Figura 2. Relacin entre Coste y Fiabilidad ............................................................................................ 5
Figura 3. Relacin Tpica entre Confiabilidad y Coste del Ciclo de Vida para la Fase de Operacin y
Mantenimiento ...................................................................................................................................... 6
Figura 4. Representacin de los Estados TBF y TTR. .............................................................................. 7
Figura 5. Curva de Davies o Baera de la Funcin de Riesgo Combinado. .......................................... 11
Figura 6. Diferentes Curvas de Fallos en el Tiempo en el Sector Aeronutico .................................... 12
Figura 7. Funciones que Forman la Curva de Davies............................................................................ 13
Figura 8. Soluciones posibles segn tipo de Fallos............................................................................... 14
Figura 9. Funcin de Densidad de una Normal. ................................................................................... 15
Figura 10. Funcin de Distribucin de una Normal.............................................................................. 16
Figura 11. Funciones de Fiabilidad de una Normal. ............................................................................. 16
Figura 12. Funcin de Riesgo o Tasa de Fallo de una Normal. ............................................................. 17
Figura 13. Funcin de Riesgo Acumulado de una Normal. .................................................................. 17
Figura 14. Funcin de Densidad de una Log-Normal. .......................................................................... 18
Figura 15. Funcin de Distribucin de una Log-Normal. ...................................................................... 19
Figura 16. Funciones de Fiabilidad de una Log-Normal. ...................................................................... 19
Figura 17. Funcin de Riesgo o Tasa de Fallo de una Log-Normal. ...................................................... 20
Figura 18. Funcin de Riesgo Acumulado de una Log-Normal. ........................................................... 20
Figura 19. Funcin de Densidad de una Exponencial. .......................................................................... 21
Figura 20. Funcin de Distribucin de una Exponencial. ..................................................................... 22
Figura 21. Funciones de Fiabilidad de una Exponencial. ...................................................................... 22
Figura 22. Funcin de Riesgo o Tasa de Fallo de una Exponencial. ..................................................... 23
Figura 23. Funcin de Riesgo Acumulado de una Exponencial. ........................................................... 23
Figura 24. Funcin de Densidad de una Weibull. ................................................................................. 25
Figura 25. Funcin de Distribucin de una Weibull. ............................................................................ 26
Figura 26. Funciones de Fiabilidad de una Weibull. ............................................................................. 26
Figura 27. Funcin de Riesgo o Tasa de Fallo de una Weibull. ............................................................ 27
Figura 28. Funcin de Riesgo Acumulado de una Weibull. .................................................................. 28
Figura 29. Funcin de Densidad de una Gamma. ................................................................................ 30
Figura 30. Funcin de Distribucin de una Gamma. ............................................................................ 30
Figura 31. Funciones de Fiabilidad de una Gamma. ............................................................................ 31
Figura 32. Funcin de Riesgo o Tasa de Fallo de una Gamma. ............................................................ 32
Figura 33. Funcin de Riesgo Acumulado de una Gamma. .................................................................. 32
Figura 34. Funcin de Densidad de una Erlang. ................................................................................... 33
Figura 35. Funcin de Distribucin de una Erlang................................................................................ 33
Figura 36. Funciones de Fiabilidad de una Erlang. ............................................................................... 34
Figura 37. Funcin de Riesgo o Tasa de Fallo de una Erlang. ............................................................... 34
Figura 38. Funcin de Riesgo Acumulado de una Erlang. .................................................................... 35
Figura 39. Medidas de Mantenibilidad ................................................................................................ 37
Figura 40. Censura de Tipo I Generalizada ........................................................................................... 41
Figura 41. Censura de Tipo I Generalizada para 4 unidades Re-escaladas al Tiempo Cero. ................ 42
Figura 42. Diagrama de Lexis para la Censura de Tipo I Generalizada................................................. 42
Figura 43. Plantilla para Grfico de Probabilidad Weibull ................................................................... 64
Figura 44. Comparacin Grfica entre Distribuciones ......................................................................... 66

F.1
ListadodeFiguras

Figura 45. Frecuencias Esperadas y Observadas de una Muestra con la lnea de ajuste a una
distribucin Normal.............................................................................................................................. 90
Figura 46. Relacin entre x e y valores de R2 ....................................................................................... 91
Figura 47. Sistema en Serie Formado por Tres Componentes ............................................................. 93
Figura 48. Sistema en Paralelo con Tres Componentes ....................................................................... 94
Figura 49. Sistema 2 Componentes en Serie entre 3 en Paralelo. ....................................................... 94
Figura 50: Procedimiento Metodolgico en Fiabilidad y Mantenimiento. ............................................ 3
Figura 51: Histograma de Tiempo Operativo de los Dispositivos. ......................................................... 4
Figura 52. Diagrama de Cajas de Tiempo Operativo de los Dispositivos. .............................................. 5
Figura 53. Funcin de Supervivencia Estimada con Intervalo de Confianza. ......................................... 8
Figura 54. Comparativa de Mtodos de Estimacin de la Funcin de Supervivencia ........................... 9
Figura 55. Funcin de Distribucin......................................................................................................... 9
Figura 56. Funciones de Riesgo Acumulado. ........................................................................................ 10
Figura 57. Comparativa de Mtodos de Estimacin de la Funcin de Riesgo Acumulado .................. 10
Figura 58. Funcin de Supervivencia con Modelos Paramtricos........................................................ 11
Figura 59. Funcin de Riesgo con Modelos Paramtricos ................................................................... 12
Figura 60. Funcin de Riesgo Acumulado con Modelos Paramtricos ................................................ 12
Figura 61. Funcin de Supervivencia o Fiabilidad Weibull Figura 62. Funcin de Riesgo Weibull .. 13
Figura 63. Funcin de Riesgo Acumulado Weibull ............................................................................... 14
Figura 64. Modelacin de las Observaciones con varias Distribuciones Tericas ............................... 15
Figura 65. Grfico de Probabilidad de Weibull .................................................................................... 18
Figura 66. Grfico de Probabilidad para obtencin de parmetros de la distribucin de Weibull ..... 19
Figura 67. Grfico de ajuste a una distribucin de Weibull ................................................................. 20
Figura 68. Grfico de evaluacin de residuos ...................................................................................... 20
Figura 69. Intervalos de Confianza y Prediccin al 95% ....................................................................... 23
Figura 70. Funcin de Densidad ........................................................................................................... 30
Figura 71. Funcin de Distribucin....................................................................................................... 31
Figura 72. Funciones de Fiabilidad o Supervivencia............................................................................. 32
Figura 73. Funcin de Riesgo o Tasa de Fallo ....................................................................................... 33
Figura 74. Funcin de Riesgo Acumulado ............................................................................................ 34
Figura 75. Funcin de Distribucin F(t) Paramtrica (izq.) y Funcin no Paramtrica (der.) ............... 35
Figura 76. Funcin de Fiabilidad R(t) o Supervivencia S(t) Paramtrica (izq.) y Funcin no Paramtrica
(der.) ..................................................................................................................................................... 35
Figura 77. Funcin de Riesgo o Tasa de Fallo h(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)36
Figura 78. Funcin de Riesgo Acumulado H(t) Paramtrica (izq.) y Funcin no Paramtrica (der.) .... 36
Figura 79: Histograma de Tiempo de reparacin de los Dispositivos. ................................................. 38
Figura 80. Diagrama de Cajas de Tiempo de Reparacin de los Dispositivos. ..................................... 38
Figura 81. Modelacin de las Observaciones con varias Distribuciones Tericas ............................... 40
Figura 82. Grfico de Linealizacin de la Funcin de no Reparabilidad ............................................... 43
Figura 83. Grfico de ajuste a una distribucin Lognormal ................................................................. 44
Figura 84. Intervalos de Confianza y Prediccin al 95% ....................................................................... 47
Figura 85. Funcin de Densidad de Probabilidad de Reparacin......................................................... 53
Figura 86. Funcin de Mantenibilidad.................................................................................................. 54
Figura 87. Funciones de no Reparabilidad. .......................................................................................... 54
Figura 88. Funcin de Tasa de reparacin............................................................................................ 55
Figura 89. Funcin de Riesgo Acumulado ............................................................................................ 56
Figura 90. Funcin de no Reparabilidad - Estimada con Intervalo de Confianza. ................................ 59
Figura 91. Comparativa de Mtodos de Estimacin de la Funcin de no reparabilidad ..................... 59

F.2
ListadodeFiguras

Figura 92. Funcin de Mantenibilidad.................................................................................................. 60


Figura 93. Funciones de Tasa de Reparacin Acumulada. ................................................................... 61
Figura 94. Comparativa de Mtodos de Estimacin de la Funcin de tasa de reparacin acumulada 61
Figura 95. Funcin de no Reparabilidad con Modelos Paramtricos................................................... 62
Figura 96. Funcin de Tasa de Reparacin con Modelos Paramtricos............................................... 63
Figura 97. Funcin de Tasa de Reparacin Acumulada con Modelos Paramtricos ........................... 64
Figura 98. Funcin de no Reparabilidad Figura 99. Funcin de Tasa de Reparacin ...................... 65
Figura 100. Funcin de Tasa de Reparacin Acumulada...................................................................... 65
Figura 101. Funcin de Mantenibilidad M(t) Paramtrica (izq.) y Funcin no Paramtrica (der.) ...... 66
Figura 102. Funcin de no Reparabilidad Rr(t) Paramtrica (izq.) y Funcin no Paramtrica (der.) ... 66
Figura 103. Funcin de Tasa de Reparacin h(t) Paramtrica (izq.) y Funcin no Paramtrica (der.). 67
Figura 104. Funcin de Tasa de Reparacin Acumulada H(t) Paramtrica (izq.) y Funcin no
Paramtrica (der.) ................................................................................................................................ 67
Figura 105. Grficos Q-Q para una muestra de 10 Variables Aleatorias de una Distribucin de Weibull
.............................................................................................................................................................. 71
Figura 106. Grficos Q-Q para una muestra de 20 Variables Aleatorias de una Distribucin de Weibull
.............................................................................................................................................................. 72
Figura 107. Grficos Q-Q para una muestra de 40 Variables Aleatorias de una Distribucin de Weibull
.............................................................................................................................................................. 73
Figura 108. Grficos Q-Q para una muestra de 10 Variables Aleatorias de una Distribucin Log-
Normal.................................................................................................................................................. 76
Figura 109. Grficos Q-Q para una muestra de 20 Variables Aleatorias de una Distribucin Log-
Normal.................................................................................................................................................. 77
Figura 110. Grficos Q-Q para una muestra de 40 Variables Aleatorias de una Distribucin Log-
Normal.................................................................................................................................................. 78

F.3
ListadodeFiguras

F.4
ListadodeTablas

Listado de Tablas

Tabla 1. Estadsticos Descriptivos para el Tiempo Operativo TTF .......................................................... 3


Tabla 2. Estimador de Kaplan-Meier para el Tiempo Operativo TTF ..................................................... 7
Tabla 3. Informacin del Estimador de Kaplan-Meier ........................................................................... 7
Tabla 4.Parmetros de Distribucin Weibull ....................................................................................... 13
Tabla 5. Ajuste Analtico ordenado por Ks stat ................................................................................. 16
Tabla 6. Ajuste Analtico ordenado por Log_Likelihood ................................................................... 17
Tabla 7.Resultados del Estudio Comparativo de Parmetros .............................................................. 25
Tabla 8.Resultados Ordenados del Estudio Comparativo de Parmetros ........................................... 25
Tabla 9.Resultados de Anlisis en Programas Comerciales ................................................................. 26
Tabla 10. Resultados de la Regresin Lineal ........................................................................................ 27
Tabla 11. Anlisis de la Varianza de la Regresin Lineal ...................................................................... 28
Tabla 12. Test de independencia y correlacin lineal .......................................................................... 28
Tabla 13. Estadsticos de ajuste y test chi-cuadrado............................................................................ 29
Tabla 14. Test de Ajuste de Kolmogorov-Smirnov ............................................................................... 29
Tabla 15. Estadsticos Descriptivos para el Tiempo De reparacin TTR ............................................... 37
Tabla 16. Ajuste Analtico ordenado por Ks stat ............................................................................... 41
Tabla 17. Ajuste Analtico ordenado por Log_Likelihood ................................................................. 41
Tabla 18.Resultados del Estudio Comparativo de Parmetros ............................................................ 48
Tabla 19.Resultados Ordenados del Estudio Comparativo de Parmetros ......................................... 49
Tabla 20. Resultados de la Regresin Lineal ........................................................................................ 50
Tabla 21. Anlisis de la Varianza de la Regresin Lineal ...................................................................... 51
Tabla 22. Test de independencia y correlacin lineal .......................................................................... 51
Tabla 23. Estadsticos de ajuste y test chi-cuadrado............................................................................ 52
Tabla 24. Test de Ajuste de Kolmogorov-Smirnov ............................................................................... 52
Tabla 25. Estimador de Kaplan-Meier para el Tiempo de no Reparacin............................................ 58
Tabla 26. Informacin del Estimador de Kaplan-Meier ....................................................................... 58
Tabla 27.Resumen de las Pruebas de Bondad de Ajuste de Tiempos hasta el Fallo............................ 74
Tabla 28.Resumen de las Pruebas de Bondad de Ajuste de los Tiempos de Reparacin .................... 79

T.1
ListadodeTablas

T.2

Captulo I. Introduccin

CaptuloI.Introduccin

1.1 Antecedentes
La gran mayora de los dispositivos fsicos o tangibles sufren un proceso de degradacin causado
por el paso del tiempo y/o por su utilizacin. Ello significa que, a menos que se tomen medidas de
mantenimiento eficaces, cualquier dispositivo (componente o sistema) acabar fallando, i.e.:
eventualmente, el dispositivo dejar de ser operativo (dejar de realizar correctamente la funcin
que le haba sido asignada). Por tanto, se exige que los productos sean fiables. Deben desempear
sus funciones de forma segura sin excesivo impacto en el medioambiente y ser fciles de mantener
durante su vida til y as lograr la satisfaccin del cliente.
La confiabilidad de un producto es un trmino colectivo que se usa para describir la
disponibilidad de un producto y sus factores de influencia, esto es, fiabilidad, mantenibilidad y
logstica de mantenimiento.
Uno de los factores de mayor incidencia es la fiabilidad de un dispositivo (componente o
sistema), definindose como la probabilidad de que ste funcione correctamente (sobreviva sin
fallo) durante un determinado perodo de tiempo, sometido a unas condiciones de trabajo
concretas. As pues, la fiabilidad constituye un aspecto fundamental de la calidad de todo
dispositivo. Por tal motivo, resulta especialmente interesante la cuantificacin de dicha fiabilidad, de
forma que sea posible hacer estimaciones sobre la vida til del producto.
As, por ejemplo, en el caso de una avioneta monomotor, ser de gran conveniencia conocer la
probabilidad de que esta falle en diferentes etapas de su vida (tras 500 horas de funcionamiento,
800 horas de funcionamiento, etc.). El obtener una buena estimacin de la fiabilidad del motor,
posibilitar la toma de decisiones racionales acerca de cundo conviene revisarlo o cambiarlo por
otro nuevo.
Ciertas tcnicas en especial las no paramtricas, fueron inicialmente desarrolladas para su uso en
estudios mdicos y biolgicos (es decir, considerando entidades orgnicas en lugar de dispositivos)
bajo el nombre genrico de anlisis de supervivencia (comparacin de diferentes tratamientos
mdicos, determinacin de los factores que intervienen en la supervivencia de los peces de un ro,
etc.).
En la actualidad, sin embargo, la aplicacin de dichas tcnicas, en especial las paramtricas, se ha
extendido a otras reas como la econmica o la industrial bajo el nombre de anlisis de tiempos de
fallo (establecimiento de perodos de garanta de un producto, diseo de planes de mantenimiento
preventivo, etc.).

I.2
CaptuloI.Introduccin

1.2 Objetivos de la Investigacin


Los objetivos a realizar por este TFM sern los siguientes:
Obtener un conocimiento de los fundamentos de confiabilidad y en especial sobre fiabilidad de
los procesos de estimacin de distribuciones, ajuste de parmetros, eleccin y estimacin del
modelo probabilstico, su simulacin y diagnstico.
Aplicar los conceptos anteriormente expuestos a casos prcticos, estableciendo una metodologa
estadstica de anlisis, que permita estudiar, evaluar, adaptar y aplicar algunos modelos estadsticos,
que sern utilizados en la prediccin de las averas de los equipos y en la cuantificacin de su tiempo
de reparacin.
Los modelos considerados aqu para la descripcin del estado de los equipos y por tanto su
deterioro, serviran como el principal instrumento para la planificacin de su mantenimiento.
Se desarrollaran las diferentes necesidades graficas o de clculo mediante funciones o uso de
libreras actualmente realizadas en el software libre R. Siendo ste un lenguaje y entorno de
programacin orientado a objetos para anlisis estadstico y grfico
Igualmente se pretende obtener una recomendacin de las posibles lneas de investigacin que
se podran seguir en el futuro.

I.3
CaptuloI.Introduccin

1.3 Estructura del TFM


Este TFM se organizar bsicamente 6 captulos y 4 apndices claramente diferenciados:
En el CaptuloI, se exponen los objetivos y la estructura del TFM.
En el CaptuloII, se realizar una amplia revisin sobre los fundamentos de la confiabilidad. Esto
proporcionar un conocimiento inicial sobre esta ciencia y los diferentes aspectos fundamentales que
han de ser considerados cuando nos enfrentamos a ella. Se explican los conceptos fundamentales de
la Fiabilidad y sus expresiones matemticas bsicas, de igual forma con la Mantenibilidad,
definindose los conceptos bsicos estadsticos como la funcin de distribucin y densidad y se
introducen los conceptos de funcin de fiabilidad y riesgo. Asimismo, se caracterizan modelos de
distribuciones utilizados en el estudio de tiempos de vida til, como la distribucin Normal, Log-
Normal, Exponencial, Weibull, Gamma y Erlang y las relaciones existentes entre algunas de estas.
Adems, se introducen conceptos de censura y truncamiento, que aparece frecuentemente en los
estudios de fiabilidad. Se describen extensamente los mtodos estadsticos de estimacin no
Paramtrica y Paramtrica con estimaciones de los parmetros de modo grfico, puntual y por
intervalos mediante mnimos cuadrados, mxima verosimilitud y momentos. Se realiza una
explicacin de las tcnicas de inferencia a utilizar con los datos. Finaliza el captulo con una revisin
en Fiabilidad de Sistemas.
En el Captulo III, se presenta la metodologa que se usar para llevar a cabo el estudio de
investigacin.
En el CaptuloIV, se realizar el estudio prctico mediante anlisis descriptivo, no paramtrico y
paramtrico con un estudio comparativo de mtodos sobre la obtencin de los parmetros y su
bondad de ajuste tanto para Fiabilidad como para Mantenibilidad. Finalizando el captulo con la
simulacin mediante la generacin y ajuste de variables aleatorias de la distribucin seleccionada en
cada caso, Se realizara en todas las etapas un anlisis o discusin acerca de los resultados.
En elCaptuloV, se extraern las conclusiones de las aportaciones principales de esta investigacin.
Tambin se indican una serie de recomendaciones para lneas futuras de investigacin.
En el CaptuloVI, se presentan diversas referencias bibliogrficas, ya que principalmente para el
desarrollo de la aplicacin en R, el acceso a internet ha sido frecuentemente utilizado.
Se han incluido cuatro Apndices: el primero de ellos recoge informacin sobre las observaciones
de tiempos hasta el fallo TTF y de los tiempos de reparacin TTR; el segundo presenta los resultados
de anlisis no paramtrico mediante el estimador de Kaplan-Meier para ambos datos; el tercero indica
los resultados de los nmeros generados en la simulacin y el cuarto presenta el programa
desarrollado en R usado en este TFM

I.4
CaptuloI.Introduccin

I.5

Captulo II. Fundamentos Tericos

CaptuloII.FundamentosTericos

2.1 Introduccin
En la actualidad, la fiabilidad, la mantenibilidad y la disponibilidad son caractersticas esenciales de
funcionamiento de los sistemas. Estas caractersticas, junto con el funcionamiento del soporte de
mantenimiento se conocen colectivamente como confiabilidad.
Pero en sus inicios, el enfoque inicial fue realizado sobre la fiabilidad, atribuyendo su origen de
estudio a la evaluacin de la mortalidad derivada de las epidemias y a los mtodos actuariales
desarrollados por las compaas de seguros, para determinar el riesgo de sus plizas. La herramienta
utilizada para el clculo de esta fiabilidad eran las tablas de vida.
A principios de 1900 se utilizaban los mtodos actuariales para estudiar la supervivencia de
pacientes con determinados tratamientos y para estudiar la fiabilidad de los ferrocarriles. La teora
matemtica de la fiabilidad se desarrolla por las demandas de la tecnologa. El rea de mantenimiento
de mquinas es donde la fiabilidad se aplica con sofisticadas tcnicas matemticas.
En 1939 Walodie Weibull, propuso una distribucin para describir la duracin de los materiales,
que ms tarde se denominara distribucin de Weibull. Esta distribucin es utilizada en infinidad de
aplicaciones debido a su gran versatilidad.
En 1953 Epstein y Sobel comenzaron a trabajar con la distribucin Exponencial como modelo para
estudiar la vida til de un dispositivo en funcin del tiempo. La distribucin exponencial no tiene
memoria, es decir, el tiempo de vida til de un determinado dispositivo no influye en la probabilidad
de que este falle. La popularidad de esta distribucin es el gran uso que se ha hecho de ella en trabajos
de fiabilidad debido a su simplicidad en los clculos.
En los aos noventa, la investigacin de la fiabilidad toma nuevas direcciones gracias a M. B.
Mendel. Sus mtodos se pueden encontrar en publicaciones sobre problemas de fiabilidad en la
ingeniera, entre los que destacan los de Shortle y Mendel (1996).
Una definicin probabilstica de la fiabilidad la presenta Meeker y Escobar (1998), que la define
como la probabilidad de que una unidad realice su funcin hasta un tiempo especificado bajo las
condiciones de uso encontradas.
Otra perspectiva, orientada hacia el cliente o usuario del producto final, es la proporcionada por
Condra (2001), que afirma que un producto fiable es aquel que hace lo que el usuario quiere que
haga cuando el usuario quiere que lo haga. De acuerdo con esta definicin, la fiabilidad sera calidad
a travs del tiempo.
Dependiendo del enfoque dado a la fiabilidad, puede tambin encontrarse su vinculacin con el
concepto de misin, esta idea aparece vinculada a los inicios de estos estudios, en el contexto de
equipos diseados para su uso militar, aunque hoy en da sigue siendo utilizada tambin en diferentes
campos. En este caso, se transforma el concepto de fiabilidad a confiabilidad, a que el equipo funcione
correctamente durante el tiempo de misin.

II.2
CaptuloII.FundamentosTericos

Histricamente, parte de la metodologa sobre estimacin de la vida til de los productos fue
inicialmente desarrollada para materiales militares. Uno de los primeros ejemplos constatados de
anlisis de tiempos de vida fue el empleado para estimar el nmero de repuestos necesarios para
mantener equipos electrnicos y mecnicos funcionando en forma intensiva por perodos largos de
tiempo durante la guerra de Corea. Los responsables de armamento verificaron que uno de los
problemas de fallos estaba relacionado con las condiciones ambientales extremas.
En algunos sectores de la industria, como en ingeniera la fiabilidad est orientada al estudio de los
tiempos de fallo. El problema reside en predecir si se puede producir un fallo y cundo ocurrir. Esta
informacin es muy til para las polticas de mantenimiento e inspeccin de una empresa as como
los plazos de garanta de los productos. Tambin es muy til para predecir costes debidos al
mantenimiento y a los fallos ocasionales que pueden ocurrir durante el tiempo de vida del dispositivo.
Mientras que en el sector farmacutico o el alimentario, se usa un trmino ms especfico, estabilidad,
para referirse a los casos en que la fiabilidad depende de la conservacin de una determinada
composicin qumica. En las ciencias de la salud, en las que se tratan cuestiones bastante parecidas a
las de la fiabilidad, se usa la expresin anlisis de la supervivencia, siendo en este campo en el que se
ha investigado con ms ahnco en la implementacin de nuevos mtodos estadsticos. Estos estudios
de Supervivencia, centrados en estimar la vida de los enfermos, se pueden y deben aprovechar para
la estimacin de tiempos de vida de productos industriales.
Aunque los estudios de fiabilidad son de gran utilidad en todas las ramas de la industria por su
amplia aplicacin, han surgido tcnicas y normativas especficas para el estudio de la fiabilidad de
componentes electrnicas y para la fiabilidad de los programas informticos, rama esta ltima que se
engloba en la denominada fiabilidad del software. As, Lawless (2000) dice la fiabilidad se refiere al
funcionamiento adecuado de equipos y sistemas, lo cual incluye factores como software, hardware,
humanos y ambientales.
Al igual que ocurre en el caso de la calidad, tambin existen normativas especficas que regulan la
fiabilidad, la mantenibilidad y la disponibilidad, entre ellas cabe destacar la norma UNE-EN 60300 de
Gestin de la confiabilidad.

II.3
CaptuloII.FundamentosTericos

2.2. Conceptos Fundamentales


2.2.1. Confiabilidad
La confiabilidad ha sido especificada mediante las caractersticas intrnsecas del sistema de
disponibilidad, fiabilidad, mantenibilidad y soporte de mantenimiento (fig. 1). Sin embargo, otros
factores pueden reducir significativamente los niveles logrados para estas medidas, por debajo de los
niveles intrnsecos. Potencialmente, los ms importantes son la calidad de la fabricacin y el
mantenimiento del sistema, que pueden introducir nuevas averas en el mismo.
Los niveles de fiabilidad, mantenibilidad, disponibilidad y soporte de mantenimiento conseguidos
por un sistema dependen de las condiciones en las que se utiliza y tambin del perfil de su misin.
Puede ser importante tener en cuenta no slo las condiciones en las que operar el sistema sino
tambin la poltica de mantenimiento y la organizacin para el soporte de mantenimiento del mismo.

Figura1.RelacionesdelaConfiabilidad

Por tanto, es esencial que se gestione activamente la confiabilidad a lo largo del ciclo de vida del
sistema. Esto abarca tanto el proceso de adquisicin como el de utilizacin, y las actividades de gestin
requeridas sern distintas en uno y otro caso. Si la confiabilidad no se gestiona adecuadamente ya sea
en el proceso de adquisicin o durante la utilizacin, existe una mayor probabilidad de que no se
alcancen los requisitos de fiabilidad o de disponibilidad.
El ciclo de vida del sistema puede tener un efecto significativo en la confiabilidad conseguida del
sistema. Adems, la fiabilidad puede variar a lo largo de la vida, ya que muchos sistemas pueden
presentar tasas de fallo variables con el uso, debido a desgaste de componentes o subsistemas. Esta
variacin de las caractersticas de fiabilidad con el uso significa que, para muchos sistemas, no es vlida
la hiptesis de tasa de fallo constante y que tienen que emplearse distintas distribuciones de
probabilidad, que requieren expresiones matemticas ms complejas, para estimar las caractersticas
de fiabilidad (IEC 61649, IEC 61703 e IEC 61710).

II.4
CaptuloII.FundamentosTericos

Los cambios en el uso del sistema son un factor adicional que afecta a las caractersticas de
fiabilidad. As, la misin o el uso del sistema son una parte esencial de la especificacin de confiabilidad
y tienen que observarse y gestionarse los cambios como parte del ciclo de vida de confiabilidad.

2.2.1.1. Coste del Ciclo de Vida


Actualmente se exige que los productos sean fiables. Deben desempear sus funciones de forma
segura sin excesivo impacto en el medioambiente y ser fciles de mantener durante su vida til. La
decisin de compra no solo est condicionada por el coste inicial del producto (coste de adquisicin)
sino tambin por la previsin de coste de operacin y mantenimiento del producto durante su vida
til (coste de propiedad) y por el coste de eliminacin. Para lograr la satisfaccin del cliente, el reto
de los fabricantes es lograr productos que cumplan los requisitos, sean fiables y tengan un coste
competitivo mediante la optimizacin de los costes de adquisicin, propiedad y eliminacin. Adems,
los sistemas que fallan repetidamente adquirirn pobre reputacin frente al usuario. Por otra parte,
disear y fabricar sistemas con altos niveles de fiabilidad puede ser caro y posiblemente no se puedan
producir a un precio competitivo. Por tanto, hay que encontrar un equilibrio entre sistemas de baja
fiabilidad que son muy costosos de mantener y sistemas de alta fiabilidad que pueden ser caros de
disear y construir. Esto se ilustra en la figura 2, en la que se muestran los costes de diseo y operacin
de sistemas de distinta fiabilidad.

Figura2.RelacinentreCosteyFiabilidad

La figura 2 muestra que hay un nivel de fiabilidad para el que se minimizan los costes totales
durante la vida del sistema. Si se trata de un sistema comercial, este nivel mnimo de coste cambiar
en la medida en que los costes de diseo y desarrollo puedan repartirse entre muchas unidades. Sin
embargo, la fiabilidad ptima de un sistema puede estar afectada por otros aspectos tales como los
requisitos de seguridad o la funcin del sistema y no tiene por qu coincidir, necesariamente, con la
fiabilidad correspondiente al mnimo coste del ciclo de vida.

II.5
CaptuloII.FundamentosTericos

2.2.1.2. Costes Relativos a la Confiabilidad


Los costes asociados con los elementos de confiabilidad pueden incluir, cuando se apliquen, lo
siguiente:
Coste de restablecimiento del sistema incluyendo el coste de mantenimiento correctivo;
Coste de mantenimiento preventivo;
Costes de las consecuencias.

La figura 3 destaca algunos elementos de confiabilidad convertidos en costes de operacin y


mantenimiento.

Figura3.RelacinTpicaentreConfiabilidadyCostedelCiclodeVidaparalaFasedeOperacinyMantenimiento

La Confiabilidad se ha considerado bajo los siguientes cuatro aspectos:


Disponibilidad
Fiabilidad (R(t), incluyendo tiempo medio hasta el fallo (MTTF) (Mean Time To Failure),
tiempo medio de funcionamiento entre fallos (MTBF) (Mean Time Between Failures).
Mantenibilidad, incluyendo tiempo medio de indisponibilidad (MDT) (Mean Down Time) y
tiempo medio hasta la restauracin (MTTR) (Mean Time To Restoration).

II.6
CaptuloII.FundamentosTericos

Soporte de mantenimiento.

2.2.2. Disponibilidad
Para algunos sistemas, especialmente para sistemas complejos, es necesario considerar
conjuntamente la fiabilidad y el mantenimiento. En tales sistemas puede ser conveniente especificar
requisitos de disponibilidad a nivel de sistema en vez de especificar por separado requisitos de
fiabilidad y de mantenibilidad. Los requisitos de disponibilidad en rgimen permanente son los ms
comnmente utilizados aunque tambin puede ser adecuada la disponibilidad media.
Industrias en las que la disponibilidad puede ser la principal caracterstica de confiabilidad, son,
por ejemplo, el sector ferroviario, en el que los operadores ferroviarios exigen un porcentaje de trenes
disponibles para su utilizacin durante periodos de punta o un retraso mximo, y el sector de las
telecomunicaciones, donde el operador requiere un cierto nmero de canales de comunicacin
disponibles, de forma que el sistema mantenga una disponibilidad general, aunque ciertas rutas
puedan estar no disponibles debido a los distintos enrutamientos existentes.
Se define la disponibilidad D(t) como la probabilidad en el tiempo de asegurar un servicio
requerido. Otra definicin comn en para la disponibilidad es: el porcentaje de equipos o sistemas
tiles en un determinado momento, frente a la totalidad de equipos o sistemas.
La ecuacin de la disponibilidad est en funcin de la fiabilidad y de la mantenibilidad, siendo:
R t MTBF
D t
R t M t MTBF MTTR

En la Figura 4 se aprecia cmo se conforman el MTBF (Mean Time Between Failures) .por los
distintos TBF que hacen referencia al tiempo de funcionamiento de un activo y el MTTR (Mean Time
To Restoration) por los TTR que se refieren a los tiempos de paradas por reparacin.

Figura4.RepresentacindelosEstadosTBFyTTR.

II.7
CaptuloII.FundamentosTericos

2.2.3. Fiabilidad
2.2.3.1. Fiabilidad en Funcin del Tiempo
En algunos sistemas, es necesario considerar directamente su fiabilidad. En tales sistemas, puede
ser apropiado especificar por separado los requisitos de fiabilidad y de mantenibilidad a nivel del
sistema. Por definicin, la fiabilidad es la capacidad de un sistema para realizar una funcin requerida
en condiciones determinadas durante un intervalo de tiempo dado, esto es sin fallo.
Sin embargo, muchas especificaciones definirn la fiabilidad requerida mediante el empleo de
medidas alternativas, tales como el tiempo medio hasta el fallo (MTTF) (Mean Time To Failure) o el
tiempo medio de operacin entre fallos (MTBF) (Mean Time Between Failures).
Una definicin correcta de la fiabilidad sera como la probabilidad de que el sistema complete su
funcionamiento satisfactorio a lo largo del tiempo. El supuesto subyacente implcito es que en una
muestra de dispositivos idnticos, la supervivencia (o duracin de vida) se dispersa de una manera
que se modela bien con la probabilidad y, por tanto, con una funcin de distribucin. Por tanto, la
extensin de las medidas de fiabilidad para incluir el tiempo implica la especificacin de las
distribuciones de probabilidad, las cuales deben ser modelos razonables de la dispersin de duracin
de vida.
Entre las industrias en las que las caractersticas de fiabilidad pueden ser la principal caracterstica
de confiabilidad, se pueden citar la industria aeroespacial, donde una vez que un avin ha despegado
es esencial que complete el vuelo sin un fallo total y la industria automovilstica, donde el conductor
necesita llegar a su destino y puede efectuar el mantenimiento del vehculo una vez que se encuentra
en su destino.
Por tanto, es conveniente distinguir entre productos reparables y no reparables:
Productos no reparables: solo un fallo puede ocurrir. Ejemplos: bombillas de luz,
transistores, motores a propulsin, microprocesadores, etc.
Productos reparables: ms de un fallo puede ocurrir. En este caso es importante considerar
la disponibilidad del producto reparado (que depender de la ocurrencia de fallos y del
tiempo de mantenimiento. Ejemplos: automviles, lavadoras, etc.

2.2.3.2. Medidas de Fiabilidad


La fiabilidad puede ser indicada y cuantificada mediante diversas funciones que son indicados a
continuacin:
La medida inicial de la fiabilidad sera el MTBF (Mean Time Between Failures) o tiempo
medioentrefallos.

II.8
CaptuloII.FundamentosTericos


MTBF R t dt
0

En la prctica, la fiabilidad se mide como el tiempo medio entre dos fallos consecutivos
MTBF. Se puede medir en general por horas, kilmetros, horas de vuelo, piezas
producidas,... etc.
R(t) es la Funcin de Fiabilidad (Reliability Function) o funcin de supervivencia en el
tiempo t, o dicho de otro modo, la probabilidad de que un componente nuevo sobreviva
ms del tiempo t, donde T se define de forma genrica como el tiempo de vida del
componente, siendo una variable continua y que toma valores en el intervalo [0, ).

R t P t f t dt 1 F t
t

Esta funcin es continua, montona decreciente y adems verifica que:


R(0) = 1
y

R lim 1 F t 0
t

F(t) es la Funcin de Distribucin de la variable aleatoria continua T, representa la


probabilidad acumulada de fallo hasta el tiempo t, es decir:
F(t) = P(T t)
Esta funcin es continua, montona no decreciente y adems verifica que:
lim F t 0
t

y
lim F t 1
t

El p-cuantil de la distribucin de T es el valor tpque verifica:


F(tp) = P(T tp) = p
lo que equivale a la expresin:
tp = F-1(p)
donde F-1 es la funcin inversa de F.
Derivando la funcin de distribucin obtenemos la FuncindeDensidad f(t). sta nos da
una idea de la dispersin de la vida del componente:
dF t dR t
f t
dt dt
La vida esperada o tiempo medio entre fallos MTBF est relacionada con la funcin de
densidad a travs de la esperanza matemtica del tiempo de vida T mediante la expresin:

E tf t dt MTBF
0

II.9
CaptuloII.FundamentosTericos

La vida esperada o MTBF para sistemas no reparables, se convierte en tiempo medio hasta
el fallo (MTTF) (Mean Time To Failure).
Un concepto importante a considerar cuando se trabaja con distribuciones asociadas a
tiempos de vida es la FuncindeRiesgo (hazard function)oTasadeFallo (failure rate) h(t),
que se define como la probabilidad instantnea de que una componente falle en el
instante t. En trminos de probabilidad se interpreta como el lmite de la probabilidad
condicionada de que T falle antes del tiempo t + t conociendo que no haba fallado en el
instante t. Esto no es ms que el cociente entre la funcin de densidad f(t) y la funcin de
fiabilidad R(t). Entonces, la funcin de riesgo h(t) seria:
f t
h t
R t

La funcin de riesgo h(t) es una caracterstica de fiabilidad del componente. No tiene


interpretacin fsica directa. Es bastante comn que el comportamiento de fallos de un
componente sea descrito en trminos de su tasa de fallos.
H(t) es la Funcin de Riesgo Acumulada (cumulative hazard rate) o tasa de fallos
acumulada y se define como:
t
H t h t dt
0

La funcin de riesgo acumulada H(t) y la funcin de distribucin F(t) verifican la siguiente


relacin:
H(t) = - log(1 - F(t)).

La funcin de riesgo h(t) es una caracterstica importante de las distribuciones asociadas a variables
correspondientes a tiempos de vida:
Funciones de riesgo decrecientes.
Se observa en productos cuya probabilidad de fallo es menor cuando aumenta el tiempo
de supervivencia. Esto aparece a menudo en cualquier tipo de materiales: al principio de
su funcionamiento la probabilidad de fallo es alta debido a la existencia de posibles
defectos ocultos. A medida que transcurre el tiempo est probabilidad se estabiliza a un
nivel ms bajo, pues si el elemento ha sobrevivido ser porque no tena ese defecto oculto.
Funciones de riesgo constantes.
Indica que la probabilidad de fallo instantneo es la misma en cualquier momento y
consecuentemente el proceso no tiene memoria, ya que la posibilidad de fallo estando
funcionando, es idntica en cualquier momento de la vida del componente. A pesar de que
esto pueda parecer irreal, este tipo de modelo es muy utilizado en la prctica, tanto por su

II.10
CaptuloII.FundamentosTericos

sencillez como por el hecho de que representa bien los periodos intermedios de vida de
muchos productos. Por ejemplo si se tienen componentes electrnicos cuya es vida es muy
larga instalados en sistemas que cuentan con elementos mecnicos de vida til muy
inferior, el modelo de tasa de fallos constante es perfectamente adecuado.
Cabe esperar tasas de fallo constantes cuando el fallo se produce por cargas excesivas que
se producen aleatoriamente en el tiempo.
Tienden a aparecer en conjuntos donde los fallos son debidos a un fenmeno aleatorio
como accidentes o shocks.
Funciones de riesgo crecientes.
Surgen, en la mayora de los casos por desgastes y fatigas, es decir por un proceso de
envejecimiento. La tasa de fallos creciente indica que la probabilidad de fallo inmediato,
teniendo en cuenta que el componente est funcionando, se incrementa a medida que
pasa el tiempo. Evidentemente a medida que un componente se hace ms viejo, su tasa
de fallos tender a crecer.

La generalizacin del proceso anterior conduce a la curvadeDaviesobaera (Bathtub Curve), que


se corresponde con la figura 5 y representa la probabilidad de fallo instantneo de un elemento que
se comporta inicialmente de forma decreciente (a esta zona se le denomina de mortalidad infantil),
en su vida media con una probabilidad de fallo casi constante (zona de vida til), y finalmente con
probabilidad de fallo que aumenta con la edad (zona de deshecho, wearout). Esta curva es muy
habitual en elementos reales, aunque en la prctica muchas veces se simplifique estudiando
nicamente su zona central, que tiene tasa de fallo constante.

Figura5.CurvadeDaviesoBaeradelaFuncindeRiesgoCombinado.

II.11
CaptuloII.FundamentosTericos

Estudios actualizados en el sector aeronutico y militar principalmente, han demostrado que los
mecanismos de formacin de fallos no tienen por qu seguir las pautas de la combinacin de las tres
formas de riesgo o fallo indicadas anteriormente (curva de Davies o baera).
En la Figura 6 se presentan las distintas curvas de fallos a lo largo del tiempo y el porcentaje de
cada uno ellos segn un estudio de la FAA (Federal Aviation Agency) Americana.

Figura6.DiferentesCurvasdeFallosenelTiempoenelSectorAeronutico

Curva A. La curva de Davies: Alta mortalidad infantil, seguida de un bajo nivel de fallos
aleatorios, terminado en una zona de desgaste. Slo un 4% de los fallos siguen esta curva.
Coincide con equipos mecnicos histricos.
CurvaB. El tradicional punto de vista: Pocos fallos aleatorios, terminando en una zona de
desgaste. Slo un 2% de los fallos siguen esta curva. Coincide con Equipos o Sistemas
sometidos a fatiga y no diseados para vida infinita como por ejemplo sistemas
electrnicos discretos.
Curva C. Un constante incremento en la probabilidad de fallo. Slo un 5% de los fallos
siguen esta curva. Coincide con equipos o sistemas sometidos a corrosin.

II.12
CaptuloII.FundamentosTericos

CurvaD. Un rpido incremento en la probabilidad de fallo, seguido de un comportamiento


aleatorio. Slo un 7% de los fallos siguen esta curva. Coincide con equipos electrnicos
digitales.
Curva E. Fallos aleatorios: No hay relacin entre la edad funcional de los equipos y la
probabilidad de que fallen. Slo un 14% de los fallos siguen esta curva. Coincide con fallos
en rodamientos bien diseados.
Curva F. Alta mortalidad infantil, seguida de un comportamiento aleatorio de la
probabilidad de fallos. El 68% de los fallos siguen esta curva. Coincide con fallos en equipos
o sistemas hidrulicos y neumticos de diseo actual.

La conclusin obtenida del estudio de la aviacin fue que slo un 6% siguen el desarrollo de fallos
segn las funciones A+B, y slo en stas, ser efectivo la aplicacin de los mantenimientos
preventivos.
Por lo tanto, existe otro 94 % de fallos que debido a su alta componente aleatoria de aparicin de
los fallos no se consideraba inicialmente realizar un mantenimiento preventivo. ste slo inducir en
la aparicin de nuevos fallos por la manipulacin innecesaria de los equipos y producir un aumento
en los costes por mantenimiento.
En la Figura 7 se muestra las tres funciones que forman la curva de Davies

Figura7.FuncionesqueFormanlaCurvadeDavies.

En la Figura 8 se presenta una matriz con las posibles soluciones en funcin del tipo de fallo
producido.

II.13
CaptuloII.FundamentosTericos

Figura8.SolucionesposiblessegntipodeFallos.

2.2.3.3. Distribuciones Estadsticas


El criterio de seleccin de una distribucin probabilidad a utilizar en un anlisis de fiabilidad se basa
usualmente mediante la funcin de riesgo, pues de acuerdo a la informacin que el investigador tenga
del fenmeno que causa el fallo, puede determinar las caractersticas que el modelo debe seguir en
la forma de la tasa de fallo conforme avanza el tiempo (creciente, decreciente o en forma de baera).
En principio, se puede utilizar cualquier funcin de distribucin para crear un modelo de duracin
de vida de los equipos. En la prctica, las funciones de distribucin que tienen funciones de riesgo
monotnicas parecen ms realistas y, dentro de esta clase, existen unas pocas que son consideradas
como aquellas que proporcionan los modelos ms razonables de fiabilidad de dispositivos.
Se presentan a continuacin las distribuciones ms comunes en modelos de fiabilidad con sus
expresiones matemticas y representacin grfica realizadas mediante R, (Apndice 4, apartado 1).

2.2.3.3.1. Distribucin Normal


Es la distribucin utilizada con ms frecuencia en estadstica, aunque no ocurre as en estudios de
fiabilidad debido a su carcter simtrico, ya que habitualmente los tiempos de vida presentan un
comportamiento asimtrico.
Una variable aleatoria continua T tiene una distribucin Normal, y se indicara como T ~ N(., ),
siendo sus funciones principales las siguientes:
La Funcin de Densidad f(t) con t , siendo y los parmetros del modelo, que se
denominan media y desviacin tpica, respectivamente. Tiene una forma acampanada y es

II.14
CaptuloII.FundamentosTericos

simtrica respecto a la media. A continuacin se indica la expresin analtica y la


representacin grfica (figura 9) de diversas funciones de densidad para una media igual
en todas ellas ( = 3) pero con variacin en la desviacin tpica ( = 0.25, 0.5, 1 , 1.5 y 2).
1 t 2

1 2
f t e
2

Figura9.FuncindeDensidaddeunaNormal.

La FuncindeDistribucinF(t) cambia su forma en el punto del valor de la media, siendo


ms o menos pronunciada en virtud de su desviacin tpica. Su expresin se indica a
continuacin y su representacin grfica se puede observar en la figura 10.
1 t 2

t 1 2
F t e dx
2

II.15
CaptuloII.FundamentosTericos

Figura10.FuncindeDistribucindeunaNormal.

Cuando = 0 y = 1, esta distribucin se denomina DistribucinNormalEstndar, cuya


FuncindeDensidad (t) seria:
t2
1 2
t e
2
y su FuncindeDistribucin (t) seria:
t
t u du

La Funcin de Fiabilidad decrece a cero con mayor rapidez para valores pequeos de
desviacin tpica., como se aprecia grficamente en la figura 11.
1 t 2

1 2
R t e dx
t 2

Figura11.FuncionesdeFiabilidaddeunaNormal.

La Funcinde Riesgo o Tasade Falloh(t) est representada en la figura 12, se observa


claramente la influencia de la desviacin tpica en la tasa de fallo en el tiempo, con una
desviacin tpica menor el riesgo aumenta.
1 t 2

2 2

e
ht
t
Erfc
2
siendo Erfc la funcin del error complementario, definida como:

II.16
CaptuloII.FundamentosTericos

2 2
Erfc t e t dt
t

Figura12.FuncindeRiesgooTasadeFallodeunaNormal.

La FuncindeRiesgoAcumuladoH(t) sigue un patrn similar al descrito en la funcin de


riesgo, como se observa por comparacin entre las figuras 12 y 13.

Figura13.FuncindeRiesgoAcumuladodeunaNormal.

La MediaoEsperanzaMatemtica=E[T] del tiempo de fallo T vendra dada por:


E T

La VarianzaVar[T] seria:
Var T 2

II.17
CaptuloII.FundamentosTericos

El p-cuantil estara indicado por:


tp 2 InverseErfc 2p

siendoInverseErfc la funcin inversa del error complementario.

2.2.3.3.2. Distribucin Log-Normal


Este modelo de distribucin se ha utilizado en multitud de aplicaciones asociadas a ingeniera,
medicina. Se dir que la variable aleatoria T sigue una distribucin Log-Normal, y lo denotaremos
como LogN(, ), si la variable Y = log T sigue una Distribucin Normal con media y desviacin tpica
. Por lo tanto, sus funciones ms significativas serian:
La FuncindeDensidadf(t) de una variable aleatoria Y para una DistribucinNormal estara
representa por:
1 y 2

1 2
f y e
2
con y , entonces la FuncindeDensidadf(t) de T = exp(Y), para la DistribucinLog-

Normal sera:
1 ln t 2

1 2
f t e
t0
t 2
En la figura 14 se representa la funcin de densidad para la distribucin Log-Normal para
= 1 y = 0.25, 0.5, 1, 1.5.y 2.

Figura14.FuncindeDensidaddeunaLog-Normal.

La FuncindeDistribucinF(t) se expresara mediante:

II.18
CaptuloII.FundamentosTericos

lnt
F t

donde es la funcin de DistribucinNormalEstndar indicada en el apartado 2.2.3.3.1.
La funcin de distribucin est representada en la figura 15, teniendo cierta similitud a la
funcin de densidad de la distribucin normal.

Figura15.FuncindeDistribucindeunaLog-Normal.

LaFuncindeFiabilidadR(t) decrece ms suavemente a cero que la funcin de fiabilidad


de la distribucin normal, fcilmente apreciable por comparacin entre las figuras 11 y 16.

lnt
R t 1 F t 1

Figura16.FuncionesdeFiabilidaddeunaLog-Normal.

II.19
CaptuloII.FundamentosTericos

La FuncindeRiesgooTasadeFalloh(t) que se representa en la figura 17, se caracteriza


por valer cero en t = 0, y se puede observar, para el caso = 2, que la funcin crece hasta
un mximo y a continuacin decrece, acercndose a cero a medida que t tiende a .
1 lnt 2

2 2

e
ht
lnt
t Erfc
2

Figura17.FuncindeRiesgooTasadeFallodeunaLog-Normal.

La FuncindeRiesgoAcumuladoH(t) sigue un patrn similar al descrito en la funcin de


riesgo acumulada de la distribucin normal, como se observa por comparacin entre las
figuras 13 y 18.

Figura18.FuncindeRiesgoAcumuladodeunaLog-Normal.

II.20
CaptuloII.FundamentosTericos

La MediaoEsperanzaMatemtica=E[T] del tiempo de fallo T vendr dada por:

2

E T e 2

La VarianzaVar[T] seria:
2
Var T e 2 1 e 2


El p-cuantil estara indicado por:
2 InverseErfc 2 p
tp e

2.2.3.3.3. Distribucin Exponencial


Histricamente, este modelo de distribucin fue muy utilizado en el trabajo con tiempos de vida
til, debido a la simplicidad de los mtodos estadsticos que proporciona. Sin embargo, la aplicabilidad
prctica de la distribucin exponencial ha sido muy discutida. Para una distribucin de fallo
exponencial, un dispositivo ha de ser insensible a la edad y al uso. Cualquier accin que no llegue a
producirle un fallo debe dejarle como estaba. Si no ha fallado, debe ser tan bueno como cuando estaba
en su inicio de vida. Esta propiedad da lugar a que se denomine como una funcin sin memoria.
Las funciones bsicas de esta distribucin seran las siguientes:
La FuncindeDensidad f(t) de una variable aleatoria T con distribucin exponencial seria:
t
1

f t e t 0

Es una funcin decreciente y tiende a cero cuando t , como se puede observar en la
figura 19, siendo > 0 el parmetro de escala del modelo y cuando es igual a 1, se le
denomina distribucin exponencial estndar.

Figura19.FuncindeDensidaddeunaExponencial.

II.21
CaptuloII.FundamentosTericos

La FuncindeDistribucinF(t) quedara expresada por :


t t t t
t t1

F t f t dt e dt e 1e t0
0 0
0

y su representacin grfica se indica en la figura 20. Es una funcin creciente y tiende a 1


cuando t .

Figura20.FuncindeDistribucindeunaExponencial.

La Funcin de Fiabilidad R(t) es una funcin decreciente y tiende a 0 cuando t ,


representndose en la figura 21.
t


R t 1 F t e t0

Figura21.FuncionesdeFiabilidaddeunaExponencial.

II.22
CaptuloII.FundamentosTericos

La FuncindeRiesgooTasadeFalloh(t) para un dispositivo sin taras iniciales y no afectado


aun por el desgaste, sera correcto suponer en teora que su tasa de fallo es constante. y
su valor sera el inverso del parmetro de escala del modelo, . As se puede observar en
la figura 22.
t
1

e
f t 1
ht t

Rt
e

Figura22.FuncindeRiesgooTasadeFallodeunaExponencial.

La FuncindeRiesgoAcumuladoH(t)siguen un patrn similar con pendiente diferente y


es inversamente proporcional al valor del parmetro de escala , segn se observa la
figura 23.

Figura23.FuncindeRiesgoAcumuladodeunaExponencial.

II.23
CaptuloII.FundamentosTericos

La Media o Esperanza Matemtica = E[T] del tiempo de fallo T de esta distribucin


vendra indicado por:
t
1

E T MTBF MTTF tf t dt t e dt
0 0

donde
MTBF: Tiempo medio entre fallos en sistemas reparables.
MTTF: Tiempo medio hasta el fallo en sistemas no reparables
La VarianzaVar[T] se expresara mediante:
t

2

2 1
Var T t f t dt t e dt 2

0 0
El p-cuantil estara indicado por:
1
tp log 1 p

Se suele aplica esta la distribucin en las siguientes situaciones:
En componentes de vida til muy larga, que excede la vida de servicio de los sistemas de
los que forman parte. Es el caso de componentes electrnicos.
En componentes que se sustituyen preventivamente antes de que llegue el desgaste.
En sistemas en serie compuestos de bloques exponenciales y, en la prctica, en sistemas
reparables muy complejos en los que no haya redundancias dominantes.

Es evidente que en los dos primeros casos, no es en rigor la vida media , pues slo se tiene en
cuenta la parte central de la curva de la baera. Por ello, el parmetro , tratndose de componentes
sujetos a desgaste, aunque empleados slo durante su vida til, es una vida media ficticia.
En el caso de sistemas que fallan exponencialmente, se reparan y siguen funcionando, es el
tiempo medio entre fallos (MTBF). Evidentemente, los sistemas reparables tienen una nueva vida
despus de cada reparacin. La distribucin de fallos, en general, puede variar a cada fallo, por
desgaste de los componentes que no han fallado y siguen en el sistema.
En el caso de sistemas de distribucin de fallo exponencial y no reparables, sera el tiempo medio
que transcurre hasta el fallo (MTTF).
No obstante, para los sistemas citados en el tercer apartado, las sucesivas distribuciones son
rigurosa o aproximadamente iguales, conservando el mismo valor de .

2.2.3.3.4. Distribucin Weibull


La distribucin de Weibull ayuda a conocer la causa raz de un fallo, pronosticar la cantidad de
fallos y por tanto la Fiabilidad de un equipo. Es una distribucin utilizada con asiduidad como modelo

II.24
CaptuloII.FundamentosTericos

preferido de ajuste de datos a una distribucin de frecuencias cuando no hay normalidad. Esta
distribucin es triparamtrica (, , ), es decir, se define mediante tres parmetros y es quiz el
modelo ms utilizado para tratar problemas con tiempos de vida en fiabilidad industrial.
En la literatura tcnica est muy extendida la utilizacin de la distribucin de Weibull biparamtrica
(, ), debido a que, el tercer parmetro es el parmetro de localizacin y se hace = 0, es decir, el
parmetro que localiza la abscisa a partir del cual se inicia la distribucin. Trabajando de forma
biparamtrica se ha de asumir el error de falta de localizacin.
Las funciones principales de esta distribucin serian indicadas a continuacin:
La FuncindeDensidadf(t) de una variable aleatoria continua Testara indicada por:

1 t

t

f t e t0

siendo
= parmetro de origen (slo se considera t ).
= parmetro de forma.
= 1/ = parmetro de escala o caracterstica de vida.
y su representacin grfica se muestra en la figura 24 para = 0, = 0.5, 1, 1.5, 2.5 y 3.44 y
=1.

Figura24.FuncindeDensidaddeunaWeibull.

La FuncindeDistribucinF(t) estara indicada mediante la expresin:



t
t

F t f t dt 1 e t0
0

II.25
CaptuloII.FundamentosTericos

y su representacin grfica se indica en la figura 25. Siendo esta una funcin creciente y
tiende a 1 cuando t .

Figura25.FuncindeDistribucindeunaWeibull.

LaFuncindeFiabilidadR(t) es una funcin decreciente y tiende a 0 cuando t , segn


se indica en la figura 26.

t


R t 1 F t e t0

Figura26.FuncionesdeFiabilidaddeunaWeibull.

La FuncindeRiesgooTasadeFalloh(t) est muy afectada por la variacin de la forma


dando lugar a graficas diferentes como se muestran en la figura 27.

II.26
CaptuloII.FundamentosTericos

1
f t t
ht t0
R t

Figura27.FuncindeRiesgooTasadeFallodeunaWeibull.

Si consideramos que = 0 (es decir, hay posibilidad de fallo desde t = 0), y para el valor
particular = 1, presenta tasas de fallos crecientes, decrecientes o constantes:
0 < < 1. La funcin de riesgo es decreciente, es decir, la tasa de fallo disminuye
al aumentar el tiempo (perodo infantil).
= 1. La funcin de riesgo es constante e igual a 1/, por lo que no depende del
tiempo. La distribucin, en ausencia de parmetro de origen, es exactamente la
exponencial de media .
> 1. La funcin de riesgo es creciente, describiendo bien el perodo de
desgaste.,
o 0 < 4. Perodo de desgaste tempranos,
1 < < 2. La funcin de riesgo crece rpidamente en el origen y
muy poco a medida que t crece. Fallos en piezas mecnicas
(rodamientos).
= 2 el riesgo crece linealmente con el tiempo. La distribucin
Weibull se aproxima a distribucin de Rayleigh.
2 < < 4. Crece poco con t prximo a cero y despus rpidamente.
Fatiga de piezas de baja frecuencia ( = 2.5 a 4). Fallos en correas
( = 2.5).Fallos por corrosin y erosin ( = 3 a 4). Para = 3.44, la
distribucin Weibull se aproxima a distribucin Normal.

II.27
CaptuloII.FundamentosTericos

o > 4. Envejecimiento operacional. Corrosin por esfuerzos. Prdida de


propiedades de los materiales. Algunos tipos de erosin.

La FuncindeRiesgoAcumuladoH(t)sigue un patrn nico con relacin directa del valor


de , segn se aprecia en la figura 28.

t
H t t0

Figura28.FuncindeRiesgoAcumuladodeunaWeibull.

La MediaoEsperanzaMatemtica=E[T] del tiempo de fallo T de esta distribucin vendr


dada por:

1
E T 1

1 1
Donde 1 es la funcin Gamma x , para x 1

La VarianzaVar[T] seria:
2
2
1 2
Var T 1 1

Elp-cuantil de esta distribucin seria:


1
tp log 1 p

II.28
CaptuloII.FundamentosTericos

El Parmetro de escala o caracterstica de vida = 1/ es aproximadamente el percentil 63.2 % y


se interpreta como el valor de la variable del tiempo de vida en el que han fallado el 63.2 % de las
unidades. Este 63,2% seria:

t
1
1 e 1 1 0.632 63.2%
1
F t , , 0 1 e
e

2.2.3.3.5. Distribucin de Gamma


La distribucin gamma tiene propiedades muy parecidas a las de la distribucin Weibull, pero esta
no es matemticamente fcil de tratar. Es una distribucin adecuada para modelizar el
comportamiento de variables aleatorias continuas con asimetra positiva. Es decir, variables que
presentan una mayor densidad de sucesos a la izquierda de la media que a la derecha.
En su expresin se encuentran dos parmetros, siempre positivos, y de los que depende su
forma y alcance por la derecha, y tambin la funcin Gamma (), responsable de la convergencia de
la distribucin.
El primer parmetro sita la mxima intensidad de probabilidad y por este motivo se denomina
la forma de la distribucin: cuando se toman valores prximos a cero aparece entonces un dibujo muy
similar al de la distribucin exponencial. Cuando se toman valores ms elevados de el centro de la
distribucin se desplaza a la derecha y va apareciendo la forma de una campana de Gauss con
asimetra positiva.
Es el segundo parmetro el que determina el alcance de esta asimetra positiva desplazando la
densidad de probabilidad en la cola de la derecha. Para valores elevados de la distribucin acumula
ms densidad de probabilidad en el extremo derecho de la cola, alargando mucho su dibujo y
dispersando la probabilidad a lo largo del plano. Al dispersar la probabilidad la altura mxima de
densidad de probabilidad se va reduciendo; de aqu que se le denomine escala. Valores ms pequeos
de conducen a una figura ms simtrica y concentrada, con un pico de densidad de probabilidad
ms elevado.
Las funciones ms relevantes de esta distribucin serian:
La FuncindeDensidadf(t) de la distribucin Gamma seria:
t
1
f t
t 1e

donde t > 0 y , son parmetros positivos de escala y forma respectivamente y () es la


funcin gamma dada por:

u u 1e udu
0

II.29
CaptuloII.FundamentosTericos

En la Figura 29 se muestra la funcin de densidad. Al igual que la Weibull incluye el caso


exponencial cuando = 1, se aproxima a una distribucin normal cuando .

Figura29.FuncindeDensidaddeunaGamma.

La Funcin de Distribucin F(t) estara representada en la Figura 30 e indicada por la


siguiente expresin:
t
1 t
F t t 1 e dt
0

Figura30.FuncindeDistribucindeunaGamma.

LaFuncindeFiabilidadR(t) de una distribucin gamma estara expresada como:


1 x
1 1 x 1 t 1 t
R t
e dx 1 u e u dx 1 I ,

t 0

II.30
CaptuloII.FundamentosTericos

donde I es la funcin gamma incompleta dada por:


1 t 1
I t , u e udx
0

y su representacin grfica se puede observar en la figura 31.

Figura31.FuncionesdeFiabilidaddeunaGamma.

La FuncindeRiesgooTasadeFalloh(t) es montona creciente para > 1, con h(0) = 0 y


con h(t) cuando t , y es montona decreciente cuando < 1, con h(0) = y h(t)
cuando t , como se puede apreciar en la figura 32. Donde la expresin de esta
funcin de riesgo estara dada por:
t

t 1e
ht
t
1 I ,

II.31
CaptuloII.FundamentosTericos

Figura32.FuncindeRiesgooTasadeFallodeunaGamma.

La FuncindeRiesgoAcumuladoH(t) es una funcin creciente y tiende a cuando, t


como se presenta en la figura 33.

Figura33.FuncindeRiesgoAcumuladodeunaGamma.

La MediaoEsperanzaMatemtica=E[T] seria:
E T

La VarianzaVar[T] seria:

Var T 2

2.2.3.3.6. Distribucin Erlang


La distribucin Erlang se puede ver como un caso particular de la distribucin gamma cuando =
k con kentero. Por lo que este modelo hereda las propiedades ya mencionadas en el modelo gamma
bajo las respectivas restricciones.
Un ejemplo seria de un dispositivo que est formado por k (k 1) unidades idnticas, conectadas
secuencialmente. Inicialmente solo la unidad 1 est operativa. Cuando la unidad 1 fallo la unidad 2 se
conecta automticamente, y as sucesivamente, hasta que la unidad k fallo.
Las funciones principales para esta aplicacin serian expresadas de la siguiente forma:
La FuncindeDensidadf(t) se indica su representacin grfica en la figura 34.
t
1
f t k
t k 1e
k 1 !

II.32
CaptuloII.FundamentosTericos

Figura34.FuncindeDensidaddeunaErlang.

La FuncindeDistribucinF(t)es una funcin creciente y tiende a 1 cuando t , segn


se aprecia en la figura 35.
t t k 1
1 t ti
F t k x k 1 e dx 1 e
i
k 1 ! 0
k 0 i!

Figura35.FuncindeDistribucindeunaErlang.

La Funcin de Fiabilidad R(t) es una funcin decreciente y tiende a 0 cuando t ,


representndose en la figura 36.
t k 1

ti
R t e i
k 0 i!

II.33
CaptuloII.FundamentosTericos

Figura36.FuncionesdeFiabilidaddeunaErlang.

La FuncindeRiesgooTasadeFalloh(t) es similar a la funcin gamma, pero solo se darn


valores enteros de como se aprecia en la figura 37.
k 1 1
t i 1 ti
h t i k 1 !
i
k 0 i!

Figura37.FuncindeRiesgooTasadeFallodeunaErlang.

La FuncindeRiesgoAcumuladoH(t) es una funcin creciente y tiende a cuando,


t como se presenta en la figura 38.

II.34
CaptuloII.FundamentosTericos

Figura38.FuncindeRiesgoAcumuladodeunaErlang.

La MediaoEsperanzaMatemtica=E[T] del tiempo de fallo T vendr dada por:


E T k
La VarianzaVar[T] seria:
Var T k 2

2.2.4. Mantenibilidad
La mantenibilidad es una medida importante de la confiabilidad para todos los tipos de sistemas
reparables y refleja la capacidad del sistema para ser mantenido en, o devuelto a, un estado en el que
pueda realizar la funcin requerida. Como ejemplos, se pueden citar las actualizaciones a mitad de
vida de los proyectos software para corregir niveles bajos de la disponibilidad obtenida o sistemas
remotos que son difciles de mantener. Adems, para otros sistemas, la mantenibilidad, si se
especifica incorrectamente, puede tener un efecto significativo en la confiabilidad conseguida,
especialmente en sistemas sin redundancias. Un tratamiento general de la mantenibilidad se muestra
en la Norma IEC 60300-3-10.
Una medida de la mantenibilidad es el MTTR (Mean Time To Repair) o como se conoce en
castellano Tiempo Medio de Reparacin. En la Figura 4 se present su ecuacin y la representacin
de los distintos TTR que componen el MTTR.
Se dir que un sistema es Altamente mantenible cuando el esfuerzo asociado a la restitucin sea
bajo. Sistemas poco mantenibles o de Baja mantenibilidad requieren de grandes esfuerzos para
sostenerse o restituirse.

II.35
CaptuloII.FundamentosTericos

En los siguientes apartados se indican las caractersticas ms utilizadas para la descripcin


cuantitativa de mantenimiento.
Funcin de mantenibilidad M(t), es la funcin de distribucin de la variable aleatoria DMT
(duracin de la tarea de mantenimiento). Representa la probabilidad de que la tarea de
mantenimiento considerada se realice satisfactoriamente en un tiempo especificado t
(tiempo de ineptitud total dado), o antes:
t
M t P DMT t m t dt
0

Funcin de no reparabilidad, se expresa matemticamente por:


Rr t 1 M t

Esta funcin sera similar a la funcin de supervivencia evaluada a travs de los tiempos de
fallo pero ambas funciones se presentan con connotaciones opuestas. Rr(t) se define como
la probabilidad de que el sistema no haya sido reparado previamente, mientras que en
supervivencia se define como la probabilidad de no haber fallado antes de un tiempo t.
Con lo cual, el crecimiento de Rr(t) conlleva implicaciones negativas en cuanto a la
disponibilidad del sistema, mientras que el crecimiento de R(t) sucede lo opuesto.
Funcin de densidad del tiempo de reparacin, es una funcin de densidad de probabilidad
y se expresa como:
dM t
m t
dt
Esta funcin tiene similares propiedades que la funcin de densidad del tiempo de fallos.
Por tanto, permite el clculo de la probabilidad de que una reparacin dure en un cierto
intervalo de tiempo mayor o menor que un tiempo fijado.
Tasa de reparacin en el instante t, mide la probabilidad que un sistema sea reparado en
el intervalo [t, t + t]. Conocer este parmetro resulta muy til en mantenimiento, ya que
su evolucin determina la probabilidad de que la reparacin sea completada en un instante
dado.
La Tasa de Reparacin (t) estara definida mediante:
m t
t
1 M t

El tiempo empleado en mantenimiento DMTp, representa el tiempo empleado en terminar


un porcentaje dado de las tareas de mantenimiento consideradas. El ms utilizado es el
tiempo DMT90, que representa la duracin del tiempo de recuperacin para el que el 90%
de los trabajos de mantenimiento han finalizado.

II.36
CaptuloII.FundamentosTericos

t
DMT90 t M t P DMT t m t dt 0.9
0

La duracin esperada del mantenimiento MDMT, representa la esperanza de la variable


aleatoria DMT. Matemticamente se expresa de la siguiente forma:
t
MDMT E DMT t m t dt
0

En la figura 39 se representa la grfica de una hipottica funcin de mantenibilidad

Figura39.MedidasdeMantenibilidad

2.2.5. Soporte de Mantenimiento


El soporte de mantenimiento es la capacidad de la organizacin de mantenimiento para
proporcionar los recursos necesarios para mantener un sistema, esto es, cundo y dnde se requiera,
y, a menudo, la provisin del soporte de mantenimiento es crtica para asegurar la confiabilidad de
los sistemas. Muy frecuentemente, el nivel de soporte de mantenimiento est afectado por las
condiciones de utilizacin y por factores que cambian a lo largo del ciclo de vida.
El soporte de mantenimiento ser parte de las condiciones especificadas de operacin del sistema,
un prerrequisito para los valores establecidos de fiabilidad, disponibilidad y mantenibilidad.

2.3. Mtodos Estadsticos de Estimacin de la Fiabilidad y el Mantenimiento.


Lo que ser expuesto a continuacin es totalmente valido para el Mantenimiento, pero desde un
punto de vista prctico se har referencia principalmente a la Fiabilidad.
Dada la dependencia de la fiabilidad de los sistemas de la fiabilidad de sus componentes, los
mtodos estadsticos se centran en la estimacin utilizando los datos obtenidos durante las pruebas

II.37
CaptuloII.FundamentosTericos

de vida de stos. Las pruebas pueden continuar hasta que todos los elementos de la muestra hayan
fallado, o bien se pueden interrumpir, en este ltimo caso se dira que el conjunto de datos obtenidos
ha sido censurado.
Una vez que se dispone de los tiempos de fallos observados se convierten en el conjunto de datos
al que se aplican mtodos estadsticos para obtener estimaciones de fiabilidad mediante el ajuste de
algn modelo estadstico. Si no se ha logrado identificar la distribucin de los tiempos de fallo, se
optar por un enfoque no paramtrico. Si, por el contrario, las observaciones se ajustan a alguna de
las distribuciones tericas conocidas, se optar por usar mtodos paramtricos.
Los mtodosnoparamtricostienden a ser ms sencillos. Estos mtodos son menos eficientes que
los mtodos paramtricos, pero resultan de gran utilidad cuando no se conoce ningn modelo
paramtrico que se ajuste adecuadamente a los datos, se basa en la filosofa que algunos autores han
llamado dejar que los datos decidan por s mismos. Estos proporcionan estimaciones puntuales de
R(t), f(t) y h(t) a partir de las observaciones obtenidas (sin poder suponer que stas siguen una
determinada distribucin terica). Este tipo de estudios, de gran aplicacin en el contexto del anlisis
de supervivencia, no es de uso tan frecuente en el campo de la ingeniera de estimacin de vida til o
tiempos de fallo
Los mtodosparamtricos son los ms extendidos y las estimaciones que se obtienen apoyan unos
anlisis posteriores ms detallados. Con mucha frecuencia, se han empleado para estimar funciones
de fiabilidad y realizar contrastes de hiptesis sobre las mismas. En general estos modelos son usados
en el anlisis del tiempo de vida y en problemas relacionados con la modelizacin del envejecimiento
y el proceso de fallo. El uso de mtodos paramtricos requiere la eleccin de un estadstico de
contraste adecuado. La utilizacin de ciertos estadsticos de contraste exige el cumplimiento de
determinados requisitos, referidos a los parmetros y a la distribucin poblacional. Estos requisitos
son los denominados supuestos paramtricos, entre los que se suelen encontrar los siguientes:
Las variables consideradas son cuantitativas continuas, medidas por lo menos en una
escala de intervalos.
Las muestras consideradas proceden de poblaciones en las que las variables se distribuyen
segn la ley normal. Si la distribucin de la muestra se logra aproximar a alguna
distribucin terica conocida, ser posible usar la distribucin terica para proporcionar
estimaciones de las funciones R(t), f(t) y h(t).
Se da homoscedasticidad (homogeneidad de varianzas) entre las distintas distribuciones
comparadas, es decir, las muestras proceden de poblaciones con varianzas similares.
Las muestras consideradas tienen un tamao grande. Consideraremos grande, una
muestra de tamao superior a 30 individuos (n>30).

II.38
CaptuloII.FundamentosTericos

La significacin de los resultados que obtengamos depender del cumplimiento efectivo de tales
condiciones.
Siempre que se cumplan los supuestos exigidos, las pruebas paramtricas resultan de mayor
potencia que las no paramtricas, esto es, la probabilidad de rechazar una hiptesis nula
efectivamente falsa es mayor. Teniendo esto en cuenta, el criterio que se ha de seguir de seguir a la
hora de elegir entre pruebas paramtricas o no paramtricas es el de aplicar una del primer tipo
siempre que las condiciones exigidas para ello se cumplan. Pero si no se cumplen tales condiciones, y
especialmente si el tamao muestral es muy pequeo, es preferible recurrir a las pruebas no
paramtricas.

2.3.1. Caractersticas de los Datos.


Son mltiples las ocasiones en las que solo se tienen datos completos de la variable de inters T
(tiempo de ocurrencia de un suceso, igualmente de inters) en una parte (que usualmente es
pequea) de las n unidades o unidades de la muestra que se desea analizar, mientras que del resto
solamente se tiene informacin parcial o incompleta. Esta particularidad, es la que dificulta el anlisis
estadstico en los estudios de Fiabilidad y de Anlisis de Supervivencia, pues se dice que buena parte
de los datos de la muestra vienen con datos incompletos o censurados.
Las tcnicas paramtricas tradicionales tienden a despreciar la informacin contenida en los datos
censurados lo cual puede sesgar los resultados obtenidos. Es por ello, que los datos con censura se
suelen asociar en mayor medida a los estudios de fiabilidad no paramtricos.
Las caractersticas particulares que usualmente se presentan en los datos serian la Censura y el
Truncamiento.

2.3.1.1. Censura
Normalmente, los datos asociados a tiempos de vida presentan observaciones incompletas. La
estimacin de las caractersticas de la fiabilidad cambian respecto a la estimacin clsica de muestras
completas. Un fenmeno que produce datos incompletos es la censura.
Formalmente, se dice que una observacin es censurada por la derecha de un valor C si el valor
exacto de tal observacin no es conocida pero s se sabe que excede del tiempo C. Anlogamente, una
observacin es censurada por la izquierda de C cuando slo se sabe que el valor de la observacin es
menor que C. Tambin puede aparecer la censura por intervalo, donde los datos censurados
presentan censura por la derecha y por la izquierda. Es ms comn que aparezca la censura por la
derecha que por la izquierda con datos asociados a tiempos de vida. Para poder hablar de censura se
tendr que tener en cuenta la forma en cmo se obtuvieron los datos. El problema fundamental es

II.39
CaptuloII.FundamentosTericos

determinar la distribucin de la muestra y correspondiente funcin de verosimilitud de un proceso


para as determinar los mtodos estadsticos que derivan de ello.

2.3.1.1.1. Censura por la Derecha


2.3.1.1.1.1. Censura Tipo I
Inicialmente se ha de considerar la Censura TipoI donde el evento es observado solamente si este
ocurre antes de un tiempo predeterminado, independientemente del tamao de la muestra. Un
ejemplo de este tipo de censura se puede exhibir en un estudio de ciertos elementos que comienza
con un nmero fijo de estos, a los cuales se les aplica uno o varios tratamientos, siendo la muerte de
las unidades el evento de inters. Debido al tiempo o por las consideraciones de costes, el investigador
tiene que terminar el estudio antes de que se presente el evento de inters en todas las unidades,
sacrificando a las que no han fallecido. Los tiempos de vida o supervivencia registrados para las
unidades que murieron durante el periodo de estudio son los tiempos desde el inicio del estudio hasta
su muerte. Estos son llamados observaciones exactas o no censuradas. Los tiempos de supervivencia
de las unidades sacrificados no son conocidos exactamente, pero son registrados como al menos la
longitud del estudio. Estas son llamadas observaciones censuradas. Algunas unidades podran
perderse o morir accidentalmente y sus tiempos de supervivencia hasta el momento de perderse o
morir, son tambin observaciones censuradas, pero no correspondern a la Censura Tipo I.
En censura de este tipo es conveniente usar la siguiente notacin cuando se observa a cada uno
de los n individuos hasta un tiempo predeterminado C> 0, observando si los tiempos de vida ti, con i
= 1,...,n, asociados a cada individuo son mayores o menores que este valor C. Si ti > C estaremos en
condiciones de saber que cada ti es mayor que ese valor prefijado C pero no su valor exacto, por lo
que diremos que ste es un dato censurado.
Estos datos pueden ser convenientemente representados por n pares de variables aleatorias (Zi,
i), donde:
Zi = mn(ti,C)
y

1 si ti C
i
0 si ti C

sera el indicador censura, que valdr 1 si el dato es observado y 0 si el dato es censurado.


La contribucin del par de variables (Zi, i) a la funcin de verosimilitud:
1i
f Zi i R Z i

donde los datos observados contribuyen en la expresin anterior con su funcin de densidad y los
datos censurados con su funcin de fiabilidad. Por lo tanto, la funcin de verosimilitud en el caso de
censura tipo I seria:

II.40
CaptuloII.FundamentosTericos

n n
i 1i i 1i
f T
i 1
i R Ci f Z
i 1
i R Zi

Cuando las unidades de estudio tienen diferentes tiempos de censura, fijados previamente, esta
forma de censura es llamada: Censura TipoIprogresiva. Este tipo de censura se puede representar
mediante el siguiente ejemplo que presenta dos diferentes tiempos de censura.
Suponga que se tienen 20 unidades en un experimento donde el evento de inters es la muerte.
Suponga que se han marcado 10 de color rojo y los restantes 10 de color azul, de manera que se ha
determinado a cada grupo de unidades, tiempos de censura de 42 y 104 semanas respectivamente.
De modo que las unidades con marca roja que sobrevivan 42 semanas sern sacrificadas, as como las
marcadas de color azul que lleguen vivas a las 104 semanas.

Una forma de ampliar la perspectiva de la Censura Tipo I es cuando las unidades entran al estudio
a diferentes tiempos, y el punto terminal de estudio predeterminado por el investigador es el mismo
para todas. En este caso, el tiempo de censura para cada unidad es conocido en el momento en que
entra al estudio, de manera que cada unidad tiene fijo y especificado su propio tiempo de censura.
Este tipo de censura ha sido denominado Censura de Tipo I generalizada. Este tipo de censura es
ilustrado en la figura 40 para 4 unidades, donde t1 = X1.- Tiempo de fallo para la primera unidad (1 =
1). t2 = Cr2.- Tiempo censurado por la derecha para la segunda unidad (2 = 0). t3 = X3.- Tiempo de fallo
para la tercera unidad (3 = 1). t4 = Cr4.- Tiempo censurado por la derecha para la cuarta unidad (4 =
1).

Figura X1. Censura tipo 1 generalizada para 4 unidades.

Figura40.CensuradeTipoIGeneralizada

II.41
CaptuloII.FundamentosTericos

Una representacin conveniente de la Censura de Tipo I generalizada se da al re-escalar la entrada


al estudio de cada unidad al tiempo cero como se muestra en la figura 41.

Figura41.CensuradeTipoIGeneralizadapara4unidadesRe-escaladasalTiempoCero.

Otro mtodo de representacin es mediante el diagrama de Lexis. Donde el tiempo calendario se


encuentra en el eje horizontal, y la longitud del tiempo de vida es representada por una lnea de 45.
El tiempo que una unidad pasa en el estudio es representado por la altura de la proyeccin de la lnea
en el eje vertical. Esto es ilustrado en la figura 42.

Figura42.DiagramadeLexisparalaCensuradeTipoIGeneralizada.

II.42
CaptuloII.FundamentosTericos

2.3.1.1.1.2. Censura Tipo II


Un segundo tipo de censura por la derecha es la CensuratipoII, en la cual hay dependencia del
tamao de muestra (denotado por n) y los fallos que se observen. Aqu, todas las unidades son puestas
en estudio al mismo tiempo y se finaliza cuando r de las n unidades han presentado el evento de
inters. Donde r es un numero entero positivo determinado previamente por el investigador, tal que
r < n. La notacin conveniente para este tipo de censura se presenta como sigue. Sean t1, t2, . . . ,tn los
tiempos de fallo de los n unidades y sean t(1), t(2), . . . , t(n) sus respectivas estadsticas de orden.
Entonces el final del estudio queda dado de forma aleatoria por t(r), la r-sima estadstica de orden.
Por tanto, (n - r) observaciones sern censuradas y fijadas al tiempo t(r).En este caso, el tiempo de
censura es aleatorio, pues (n - r) observaciones seran censuradas al tiempo dado por el fallo r-simo,
el cual no se conoce cuando ocurrir. De modo que esto marca una diferencia importante entre la
Censura de Tipo I y la Censura tipo II.

Tipo I C deter minstico


Censura
Tipo II X aleatorio
Formalmente, supongamos que tenemos los r tiempos de vida ordenados ms pequeos, t(1) < ...
< t(r) de una muestra aleatoria T de orden n. Si t1, ...,tn tienen distribucin continua y son
independientes e idnticamente distribuidos con funcin de densidad f(t) y funcin de fiabilidad R{t),
entonces la funcin de verosimilitud de la muestra ordenada t(1), ..., t(r) seria:
n! n r

n r !

f t1 f t r R t r

Una generalizacin de la Censura tipo II es similar a la generalizacin en la censura tipo I, con


diferentes tiempos de censura. Esta es llamada CensuratipoIIprogresiva. Aqu, el investigador debe
fijar los siguientes elementos antes de comenzar el estudio. K ser el nmero de diferentes tiempos
de censura que se realizaran a lo largo del estudio en una muestra de tamao n. r1, r2, . . . ,rk (k
nmeros enteros positivos) sern el nmero de sujetos que debern presentar el evento de inters
para determinar el respectivo tiempo de censura y n1,n2,... ,nk (k nmeros enteros positivos tales que
n1 + n2 + . . . + nk = n ) sern el nmero de unidades que deben estar fuera del estudio a cada tiempo
de censura. Con estos elementos, el estudio sera realizado de la siguiente forma:
Al presentarse los primeros r1 eventos de inters, tambin denotados por fallos, n1 - r1 unidades
sern retiradas de los n - r1 unidades sobrevivientes, quedando n - n1 unidades en el estudio. Cuando
se presenten las siguientes r2 fallos, n2 - r2 unidades sern retiradas de los (n - n1) - r2 unidades
sobrevivientes, quedando n - (n1 + n2) unidades en el estudio. Y as sucesivamente hasta que al tener
rk fallos de los n - (n1 + n2 + . . . + n(k-1) = nk unidades sobrevivientes en el estudio, los (n - n1 n2 . . . +
n(k-1)) rk= nk- rk unidades restantes sean eliminadas, dando por terminado el experimento. De este
modo, si ti denota el tiempo del i-simo sujeto en presentar el evento de inters (lo cual excluye a las

II.43
CaptuloII.FundamentosTericos

unidades removidas intencionalmente), los Ktiempos de censura sern las variable aleatoria T. tr1, tni
+r2, tn1+n2+r3, . . . , tn1+n2+ . . . + nk-1+ rk.
La Censura tipo II progresiva puede ser representada mediante el siguiente ejemplo. Suponga que
se tienen 100 unidades en un experimento donde el evento de inters es la muerte. Se definen 3
tiempos de fallo distintos. El primer tiempo de fallo se dar cuando mueran 15 unidades, en ese
momento, se retiraran del estudio 15 unidades de las 85 vivas, continuando en el estudio 70 unidades.
El segundo tiempo de fallo se dar cuando mueran 20 unidades de las 70 en estudio, en ese momento,
se retirarn 10 unidades de las 50 vivas, quedando 40 unidades en estudio. El tercer tiempo de fallo
quedara determinado cuando mueran 30 unidades de las 40 en estudio y se sacrificarn en ese
momento las 10 unidades supervivientes. De este modo, en el primer tiempo de fallo se obtendrn
15 eventos y 15 censuras, en el segundo tiempo de fallo se obtendrn 20 eventos y 10 censuras, y en
el tercer tiempo de fallo se obtendrn 30 eventos y 10 censuras.

2.3.1.1.1.3. Censura Tipo III o Aleatoria


Otro tipo de censura es la Censura tipo III o tambin llamada Censura aleatoria, la cual surge
cuando las unidades salen del estudio sin presentar el fallo por razones no controladas por el
investigador. Por ejemplo, en un estudio donde el evento de inters es la muerte por alguna razn
especfica, una unidad puede presentar Censura aleatoria si fallece por alguna razn ajena a la de
inters, o si el investigador pierde acceso a ella y esta sale del estudio.
Este tipo de procesos son aquellos en los que se supone que cada individuo tiene asociado un
tiempo de vida ti y un tiempo de censura C, donde ti y C son variables aleatorias continuas con
funciones de densidad f(t) y g(t) y funciones de fiabilidad R(t) y S(t), respectivamente. Todos los
tiempos de vida as como los tiempos censurados son mutuamente independientes. Este tipo de
censura es una generalizacin de la censura tipo I, ya que en vez de considerar un tiempo prefijado C
constante, se tendr asociado para cada ti un valor Ci, con i = 1,...,n. Como pasaba con la censura tipo
I, se tendr que:
Zi = mn(ti,C)
y

1 si ti C
i
0 si ti C

Los datos de las observaciones sobre n individuos vendrn dados por los pares (Zi, i),i= 1, . . . ,n.
Entonces, la contribucin del par (Zi, i) a la funcin de verosimilitud seria:
i 1i
f Zi S Zi g Zi R Zi

II.44
CaptuloII.FundamentosTericos

donde un dato censurado contribuye con su funcin de densidad y la funcin de fiabilidad del dato
no censurado y un dato observado contribuye con su funcin de densidad y la funcin de fiabilidad de
la censura. En este caso, la funcin de verosimilitud seria:
n
i 1i
f Z S Z
i 1
i i g Zi R Zi

2.3.1.1.2. Censura por la Izquierda


Un tiempo de vida X asociado con una unidad especfica en el estudio, es considerada censurada
por la izquierda, si esta es menor que un tiempo de censura Cl (Cl por el nombre en ingls left
censoring). Esto es, que el evento de inters le ha ocurrido a la unidad en estudio, antes de que la
unidad haya sido observada por el investigador al tiempo Cl. Para estas unidades, se conoce que han
presentado el evento en algn tiempo antes de Cl. El dato proveniente de una muestra censurada por
la izquierda puede ser representado por la pareja de variables aleatorias (T, ) donde T = X si el tiempo
de vida es observado o T = Cl si es censurado y indica cuando el tiempo de vida exacto es observado
( = 1) o no ( = 0).
Algunas veces, si la censura por la izquierda ocurre en el estudio, la censura por la derecha puede
ocurrir tambin y los tiempos de vida son considerados doblemente censurados. De nuevo, los datos
pueden ser representados por una pareja de variables (T, ) donde T = mx [min(X, Cr), Cl] es el tiempo
de estudio y i es una variable indicadora definida como sigue:

1 si T es el tiempo de ocurrencia del evento



i 0 si T es el tiempo censurado por la derecha
1 si T es el tiempo censurado por la izquierda

2.3.1.1.3. Censura por Intervalo


Este es un tipo de censura ms general que ocurre cuando el tiempo de vida se conoce que ocurre
solamente dentro de un intervalo. Este tipo de censura se presenta cuando se tiene un estudio
longitudinal donde el seguimiento del estado de las unidades se realiza peridicamente y por tanto,
el fallo slo puede conocerse entre dos periodos de revisin, generando un intervalo de la forma (Li,
Ri) para cada sujeto en el estudio.

2.3.1.2. Truncamiento
Una segunda caracterstica que puede presentarse en algunos estudios de vida o supervivencia,
son los datos truncados.
El truncamiento es definido como una condicin que presentan ciertas unidades en el estudio y el
investigador no puede considerar su existencia. Cuando los datos presentan truncamiento, solamente

II.45
CaptuloII.FundamentosTericos

a las unidades a las que les ocurre algn evento particular, antes del evento de inters o la censura,
son consideradas en el anlisis por el investigador.

2.3.1.2.1. Truncamiento por la Izquierda


Este ocurre cuando las unidades entran al estudio a una edad particular (no necesariamente el
origen del evento de inters), y son observadas desde este tiempo retrasado de entrada, hasta que
el evento ocurre o hasta que el evento es censurado.
Si Y es el momento de ocurrencia del evento que trunca a las unidades en estudio, entonces para
muestras truncadas por la izquierda, solo las unidades tales que X > Y sern consideradas.
El tipo ms comn de truncamiento por la izquierda ocurre cuando las unidades entran al estudio
a una edad aleatoria y son observadas por este tiempo retrasado de entrada, hasta que el evento
ocurre o hasta que la unidad es censurada por la derecha. En este caso, todas las unidades que
presenten el evento de inters antes del tiempo retrasado de entrada, no sern consideradas para
el experimento. Note que esto es opuesto a la censura por la izquierda, donde se tiene informacin
parcial de unidades que presentan el evento de inters antes de su edad de entrada al estudio, para
truncamiento por la izquierda, estas unidades no sern consideradas para ser incluidas en el estudio.

2.3.1.2.2. Truncamiento por la Derecha


Este ocurre cuando solo unidades que han presentado el evento son incluidas en la muestra y
ninguna unidad que haya presentado an el evento ser considerada. Un ejemplo de muestras que
presentan truncamiento por la derecha, son los estudios de mortalidad basados en registros de
muerte.

2.3.2. Estimacin no Paramtrica


En ocasiones puede resultar adecuado, o incluso necesario, iniciar el anlisis con mtodos no
paramtricos, pues stos no requieren de grandes supuestos previos sobre el modelo de las
observaciones. Los modelos no paramtricos, son mtodos analticos y grficos que permiten
interpretar los datos obtenidos, sin la distorsin que podra causar la eleccin de un modelo
paramtrico subyacente no demasiado acertado.
En los estudios no paramtricos, no se asume ningn tipo concreto de modelo probabilstico para
los tiempos de fallo y las funciones bsicas (fiabilidad, riesgo) se estiman directamente de los datos.
En algunos casos, estos mtodos no paramtricos sern suficientes para realizar el anlisis de los
datos. Sin embargo, en otras circunstancias, son un paso intermedio hacia un modelo ms
estructurado (paramtrico), que permita profundizar ms en el anlisis de las observaciones.

II.46
CaptuloII.FundamentosTericos

Se describirn a continuacin tres mtodos no paramtricos: las Tablas de Vida, el estimador


Kaplan-Meier y el mtodo de Nelson Aalen.

2.3.2.1. Tablas de Vida


Las tablas de vida tienen como objetivo describir y establecer previsiones sobre la mortalidad,
fiabilidad o supervivencia de una poblacin de inters, a partir de la consideracin de un conjunto de
datos procedentes de un estudio, a los cuales se les hace un seguimiento en un perodo de tiempo
determinado, comprobando si se registra en cada uno de las unidades o elementos, la presencia o
ausencia de una caracterstica o evento de inters (Aprendizaje de un mtodo, recuperacin fsica de
un paciente, mortalidad de un enfermo, fallo de un dispositivo, etc.) en la poblacin. La validez de ste
mtodo exige que la distribucin del tiempo de fallo de todos los individuos, censurados y no
censurados, sea la misma.
Este es uno de los mtodos ms clsicos y directos para describir la fiabilidad de una muestra a
travs de la llamada tabla de Supervivencia o Actuarial, la cual no es ms que una tabla de frecuencias
mejorada y ampliada. A partir de ella, es posible hacer una primera estimacin sobre los
comportamientos de las funciones de supervivencia R(t), distribucin F(t), densidad f(t), y tasa de fallo
h(t).
La distribucin de los tiempos de fallo se divide en un determinado nmero de intervalos que se
denotara (ti-1, ti].Para cada intervalo se registra el nmero de observaciones o dispositivos que han
entrado en buen estado ni (nmero que entra en el intervalo), el nmero de los que han fallado di
(nmero de eventos terminales), y el nmero de observaciones prdidas o censuradas en ri (nmero
que sale en el intervalo). Se calcula a partir de ellos el nmero de expuestos al riesgo, asumiendo que
las prdidas se producen homogneamente a lo largo del mismo, su nmero promedio es n'i = ni -
0.5ri. La probabilidad de fallo es la proporcin pi = di/ n'i, y la de supervivencia es qi = 1 - pi.
Casi todas las tablas de vida presentan una estructura ms o menos estndar con la descripcin
detallada de las siguientes columnas:
(ti-1, ti]: identifica los extremos del intervalo de tiempo i-simo. El extremo inferior del
primer intervalo, t0, suele ser 0; si el ensayo no termina hasta que se observe el fallo de
todos los individuos, el extremo superior del ltimo intervalo es ts-1 = .

ti : punto medio del intervalo i-simo.


li: nmero de individuos que abandonan el experimento y cuyo tiempo de censura,
pertenece al intervalo i-simo.
ci: nmero de individuos cuya respuesta o fallo no se ha observado al finalizar el instante
final ti del intervalo i-simo.

II.47
CaptuloII.FundamentosTericos

El tratamiento en el proceso de estimacin de ambos tipos de observaciones censuradas,


li y ci es idntico; por ello, en la mayora de las tablas no se hace la distincin anterior y se
define una nica columna ri,
ri: nmero de censuras en el intervalo i-simo. Desde luego, ri = li + ci
di: nmero de fallos en el intervalo (ti-1, ti]
ni: nmero de individuos en riesgo al inicio del intervalo i-simo (que permanecen vivos y
en el estudio al comienzo de ti-1). La siguiente relacin facilita su clculo:
ni ni 1 di 1 ri 1

n'i: nmero estimado de individuos expuestos a riesgo durante el intervalo i-simo. Si en


el intervalo no hay observaciones censuradas, ni = n'i, en otro caso, la hiptesis usual es
suponer que las observaciones censuradas ocurridas durante el intervalo se distribuyen en
el uniformemente. Por ello, en media, los individuos con observacin censurada estn
expuestos a riesgo durante la mitad de la duracin del intervalo, de modo que:
1
ni ni ri
2
pi: proporcin de fallo en el intervalo i-simo. Este valor estima la probabilidad de fallo en
ese intervalo, condicionada a que el individuo no haba fallado al comienzo del mismo. Si
en el intervalo no hay observaciones censuradas, el estimador natural de esta probabilidad
es di/ ni si las hay, este estimador tiende a subestimar dicha probabilidad, ya que es posible
que alguno de los individuos censurados en el intervalo muera antes de finalizar el mismo.
Por esta causa, es necesario realizar un tipo de ajuste; la alternativa habitual consiste en
sustituir n por el nmero estimado de individuos expuestos a riesgo n'i:
di
pi
ni

La validez de este ajuste, en cierta medida arbitraria, depende de las caractersticas de los
procesos de censura y de fallo. Bajo el esquema de censura aleatoria, este estimador seria
inconsistente y sesgado. Sin embargo, cuando la proporcin de censura no es excesiva y
se distribuye de forma homognea, si los intervalos no son muy amplios y los valores de ni
no son demasiado pequeos, el comportamiento de este estimador es aceptable.
qi: proporcin de supervivencia en el intervalo i-simo. Este valor estima la probabilidad
de que un individuo sobreviva al instante ti:, dado que estaba vivo al inicio del intervalo i-
simo. Se define:
qi 1 pi

II.48
CaptuloII.FundamentosTericos

P ti Ri : proporcin de supervivencia en el instante ti del ensayo. Este valor estima R(ti)=

P(T > ti) Si un individuo sobrevive hasta el inicio del intervalo (i + 1) -simo, implica que
dado que ha sobrevivido hasta el comienzo del intervalo i-simo, no falla durante el
intervalo i-simo; as:
P ti Ri qi P ti 1

Aplicando reiteradamente esta relacin y dado que P t 0 es igual a 1, se obtiene:

P ti Ri qi qi 1 q1

Este estimador de la funcin de supervivencia se llama estimador actuarial. En los instantes


que no son extremo de un intervalo, es habitual calcular su valor mediante interpolacin
lineal entre los valores de los correspondientes extremos.
f ti : tasa o proporcin de fallo en el intervalo i-simo por unidad de tiempo. Este valor

estima la funcin de densidad de T en el punto medio del intervalo de anchura bi:

P ti 1 P ti
f ti
bi

h ti : tasa instantnea condicional de fallo correspondiente al punto medio del intervalo

-simo. Con este valor se estima la funcin de riesgo en ti :

f ti f ti
h ti
P ti Ri

La estimacin de la funcin de riesgo tambin puede expresarse como:


2pi di
h ti
bi 1 qi d
bi ni i
2

PrecisindelasEstimaciones.
Los valores de qi, pi y P ti Ri son estimaciones sujetas a la variabilidad inherente al proceso de

muestreo, por lo que deben completarse con informacin relativa a su precisin. Bajo determinadas
hiptesis sobre los mecanismos de censura es posible, aunque complicado, deducir estimaciones de
sus varianzas. Por esta razn, aunque la metodologa de las tablas de vida clnicas es antigua, el estudio
terico de las propiedades estadsticas de sus estimadores es reciente y est an por completar. En
este apartado se presentan algunas de las propiedades y resultados ms utilizados. La mayor parte de
estos resultados se han obtenido para el caso de muestras completas, pero se suelen generalizar y
aplicar tambin al caso de muestras censuradas.
La estimacin ms empleada de la varianza de P t j R j seria la propuesta por Greenwood:

II.49
CaptuloII.FundamentosTericos

j pt 2 j dt
Var R j R 2j Rj t t t
t 1 q n t 1 n n d
t t

Esta estimacin, resultado de una aproximacin asinttica es razonable cuando el valor esperado
de nj no es demasiado pequeo y requiere, si la proporcin de censura en la muestra es importante,
que el nmero de intervalos considerados no sea muy pequeo. La expresin anterior tiende a
subestimar la varianza de P t j , especialmente en los intervalos de la cola derecha de la distribucin

donde el valor esperado de nj suele ser pequeo. No obstante en esos casos su clculo no es adecuado
ya que la distribucin de P t j suele ser muy sesgada y, en consecuencia, la varianza no es una buena

medida de precisin de la estimacin.

2.3.2.2. Estimador de Kaplan-Meier (KM) de la Funcin de Fiabilidad.


El impulso de las tcnicas de estimacin no paramtricas con datos censurados es relativamente
reciente. Se inicia con los aportes de Kaplan y Meier quienes publican algunos resultados obtenidos
en ese momento para observaciones censuradas a la derecha y aaden un estudio de las propiedades
bsicas de un nuevo estimador, que se conocer ms tarde con el nombre de sus creadores. De los
mtodos no paramtricos, desarrollados para estimar la funcin de fiabilidad con datos no agrupados
en presencia de censura, el ms utilizado es el estimador producto lmite de Kaplan-Meier. Dicho
mtodo descompone la supervivencia o fiabilidad de una unidad al cabo de t aos, en un producto de
probabilidades condicionadas, que deben ser previamente estimadas, antes del clculo del estimador.
La diferencia fundamental entre el mtodo actuarial y el de KM (que tambin es una funcin
escalonada), radica en que las estimaciones de Kaplan-Meier estn basadas en tiempos de fiabilidad
individuales, sin agrupar, mientras que en la estimacin por tablas de vida los individuos han sido
previamente agrupados en intervalos. La ventaja del mtodo de KM respecto a las tablas de vida, es
que las estimaciones resultantes por este mtodo no dependen de cmo se agrupan los datos en los
intervalos. De hecho, Kaplan-Meier se podra considerar como un caso particular del mtodo actuarial.
La estimacin producto-lmite es definido de la siguiente manera:
Se supone que hay observaciones de n unidades o individuos y K (K n) distintos tiempos t1 < t2 <
. . . < tk en los cuales ocurren fallos. En los n individuos se permite la posibilidad de que haya ms de
un fallo en tj, se denotara por dj el nmero de fallos en tj. Adicional a los tiempos de vida t1, . . . ,tk
existen a su vez tiempos de censura tj+, para aquellos individuos en los que el tiempo de vida no es
observado. La estimacin producto-lmite de R(t) para la duracin t, es una funcin escalonada, que
se calcula como el producto de uno menos el riesgo existente hasta el perodo t:
nj d j
R t
j:t j t nj

II.50
CaptuloII.FundamentosTericos

Donde dj representa el nmero de fallos ocurridos en el momento tj y nj es la poblacin


superviviente en el momento tj o el nmero de individuos en riesgo en tj. Si se diese el caso de alguna
observacin censurada cuyo valor coincidiera con un tiempo de fallo, se hace la hiptesis de que la
unidad censurada ocurre inmediatamente despus del tiempo de fallo y, en consecuencia, las
unidades censuradas en ese instante se contabilizan como unidades en riesgo.
El estimador KM de R(t) da una estimacin puntual o un nico valor para esta funcin en cualquier
instante t. Por lo tanto, si se desea tener una medida de la precisin de este estimador en diferentes
instantes de tiempo o sobre diferentes muestras, es necesario contar con un buen estimador de la
varianza del estimador KM, el cual viene dado por la expresin de Greewood:
2 dt
Var R t R t j:t j t
nj nj dt

Utilizando la normalidad asinttica de R t , se puede construir el siguiente intervalo de confianza

aproximado para R t , a un nivel del 100(1-)%:

R t Z
1

ee R t
2

donde Z
es el cuantil correspondiente a la distribucin normal estndar y ee
1
2

R t
Var R t es el error estndar de estimacin del estimador KM de R(t), que se calcula con
la anterior frmula de Greewood.

2.3.2.2.1. Intervalo de Confianza Usando la Transformacin log


Una forma alternativa de estimar un intervalo de confianza para la funcin de supervivencia es
transformando el valor de R t en el rango (-, ) con la transformacin log(R(t)) y obtener un

intervalo de confianza para este valor transformado. El resultado induce un intervalo de confianza
para R(t).
Este intervalo de confianza para el verdadero valor del logaritmo de la funcin de supervivencia al
tiempo t, es obtenido con el supuesto de que sigue una distribucin asinttica normal con media
k dj
log(R(t)) y varianza estimada por es una aproximaci0n de la distribucin de logR t . Por
j 1 n
j n j d j

tanto, un intervalo de un 100(1 - ) % de confianza para log(S(t)), para un valor especfico de t est
dado por:

1

log R t z s.e. log R t , log R t z s.e. log R t
1

2 2
donde

II.51
CaptuloII.FundamentosTericos

1
k dj 2

s.e. log R t
j 1 n


j nj d j
donde z1-/2 es el cuantil que acumula 1 - /2 de probabilidad en una distribucin normal estndar
Una banda de confianza para el verdadero valor de R(t) de un 100(1 - ) % de confianza para un
valor especifico de test dado por


R t exp z s.e. log R t , R t exp z s.e. log R t
1 1
2 2

Este intervalo es una forma de crear una banda de confianza para la funcin acumulativa de riesgo
H (t) puesto que H (t) = log(R(t)).

2.3.2.2.2. Intervalo de Confianza Usando la Transformacin log-log


Otra forma alternativa de estimar un intervalo de confianza para la funcin de supervivencia es
transformando el valor de R t en el rango (-, ) con la transformacin log-log dada por: log(-

log(R(t))), y obtener un intervalo de confianza para este valor transformado. El resultado induce un
intervalo de confianza para R(t).
Este intervalo de confianza para el verdadero valor del log(-log(R(t))) al tiempo t, es obtenido con
el supuesto de que una distribucin asinttica normal con media log(-log(R(t))) y desviacin estndar
t
estimada por la expresin de s.e log logR es una aproximacin de la distribucin de


log logR t . Por tanto, un intervalo de un 100(1 - ) % de confianza para log(-log(R(t))), para un

valor especfico de t est dado por




1
2

log log R t z s.e. log log R t
, log log R t z 1
s.e.
2
log log R t
donde
1

1 k dj
2


s.e. log log R t
log R t
j 1 n


j nj d j

y z1-/2 es el cuantil que acumula 1 - /2 de probabilidad en una distribucin normal estndar
Este intervalo induce una banda de confianza para el verdadero valor de SR(t) de un 100(1 - ) %
de confianza para un valor especifico de test dado por


1 2

R t exp z s.e. log log R t
, R t exp z
1

s.e. log log R t


2

II.52
CaptuloII.FundamentosTericos

2.3.2.2.3. Propiedades del Estimador Kaplan-Meier


En la literatura estadstica, las propiedades deseables en un buen estimador tienen que ver con
que sea Insesgado, Consistente, Eficiente y Suficiente, y el estimador KM, tiene varias de estas
propiedades, esto es: Consistencia, Eficiencia , ser un estimador de mxima verosimilitud para datos
censurados y adems es normalmente asinttico , lo que se traduce en una gran facilidad de clculo
y en poder ser utilizado casi con exclusividad en problemas con datos censurados a la derecha; aparte
de que cuando las estimaciones de R(t) se hacen con datos completos (ausencia de censura), su
expresin coincide con la del estimador no paramtrico de la funcin emprica de fiabilidad (FES).
Resumiendo, el estimador KM con grandes muestras, tiene muchas de las propiedades deseables
en un estimador, pero estas mismas propiedades con pequeas muestras ya no son tan robustas. En
particular, es sesgado para muestras finitas y la magnitud del sesgo es inversamente proporcional al
tamao de la muestra. De otra parte la eficiencia asinttica del estimador KM, es inferior a la del
estimador paramtrico de mxima verosimilitud, si el nivel de censura es alto o la supervivencia est
prxima a cero.
De otra parte, cuando los datos estn doblemente censurados en la estimacin no paramtrica de
R(t), se emplea con alguna frecuencia el estimador propuesto por Turnbull, el cual tiene propiedades
similares a las de KM, entre ellas la autoconsistencia para datos arbitrariamente agrupados,
censurados y truncados.

2.3.2.3. Estimador de Kaplan- Meier Ponderado (KMP)


El problema que se presenta con el estimador de Kaplan-Meier (KM) cuando la base de datos del
estudio contiene una fuerte censura o alto porcentaje de observaciones con censura, es que sus
estimaciones por lo regular, no slo tienen la tendencia a sobrestimar la fiabilidad o supervivencia de
las unidades o individuos en estudio con un alto margen de sesgo, sino que van acompaadas de muy
poca variabilidad de las estimaciones. Las estimaciones de KM obtenidas en realidad son estimaciones
sesgadas (sobrestimaciones), porque el mtodo parte del supuesto de que los dispositivos con
censura, se conservan vivos (sin averas) hasta el siguiente fallo (incluso despus de largos perodos
de tiempo). Nada ms lejos de la realidad, pues esto es como suponer que el paso del tiempo de un
ao al siguiente no tiene ningn efecto, ni accin sobre las observaciones (personas en el caso de
estudios y tratamiento de enfermedades), razn por la cual, cobra importancia la necesidad de reducir
el sesgo que producen las estimaciones de KM con datos censurados.
Para corregir en principio esta aparente debilidad, se propone una modificacin al mtodo original
de estimacin de KM y que consiste en ponderar o acompaarle a las observaciones con censura, un
factor o tasa de no censura, propuesta por Bahrawar et al. (2005), quienes aplicaron esta metodologa
con "datos de Trasplante de Corazn en Stanford, donde la variable respuesta era el tiempo de

II.53
CaptuloII.FundamentosTericos

supervivencia del paciente despus del trasplante. La tasa de censura de la base de datos de Stanford
era del 27%.
El mtodo de KMp propuesto, responde a esta situacin y considera la censura como una parte
importe del anlisis, que se involucra directamente en la frmula de su factor de ponderacin Wj,
conocido como tasa de no censura y que est definido por:
nj c j
wj con 0 w j 1
nj

De modo que si Wj = 1, no hay censura en el instante tj (pues Cj = 0), pero si Wj < 1 , en el instante
tj hay al menos una censura.
El estimador KMp, se define entonces como:
1 si t 0

nj d j
R t
j:t j t n j
0 si t 0

En este caso las estimaciones KM p R t estaran definidas para todo t 0, alcanzando el valor 0,

an en el caso de que la ltima estimacin sea censurada, se sugiere considerar la ltima observacin
censurada como un fallo, para garantizar su definicin en todo instante. Si no hay censura, R t

coincide con la funcin emprica de supervivencia FES, ya que Wj = 1 y R t coincidira con KM, que a

su vez se convierte en la FES, si todos los datos son completos.

FuncinempricadeFiabilidad(FES)
Si se tienen n tiempos de fallo ordenados, t1 t2 . . . tn, donde no hay censura, el nmero de
unidades que sobreviven el instante tj es n - i.
Por lo tanto, una plausible estimacin no paramtrica de la funcin de fiabilidad R(t) en tj, sera
simplemente la proporcin de unidades que sobreviven en el instante tj:
ni
R ti i 1 ,2 , ,n
n
En consecuencia habra una probabilidad cero de sobrevivir ms all de tn. Como es improbable
que ningn valor muestral alcance el tiempo hasta el fallo ms alto, esta expresin tiende a subestimar
la fiabilidad de la componente. En una muestra de datos sin censura, el estimador KM coincide con
este estimador, usualmente conocido como funcin emprica de supervivencia o fiabilidad (FES)

II.54
CaptuloII.FundamentosTericos

2.3.2.4. Estimador Nelson-Aalen (NA) de la Funcin de Riesgo Acumulado


Fue propuesto por primera vez en el mbito de la fiabilidad por Nelson, W., y redescubierto
independientemente por Altschuler, quien lo obtuvo utilizando tcnicas de procesos de conteo con
animales.
Dado que la funcin de riesgo acumulado est definida por H(t) = (t) = -ln R(t), un estimador
natural de esta funcin se define tambin por:
H t lnR t

Donde R t es el estimador KM de la funcin R(t). Otro posible estimador de esta misma funcin

H(t) = (t), definido por Nelson (NA), es la funcin emprica de riesgo acumulado:
dj
t t
H n
j ,t j t j

Donde dn representa el nmero de fallos ocurridos en el instante tj y nj es el nmero de individuos


en riesgo en tj.
El cociente dj/ nj, proporciona una estimacin de la probabilidad condicionada de que una unidad
que sobrevive hasta justo antes del instante tj, falle en el instante tj. Esta es la cantidad bsica a partir
de la cual se construyen los estimadores de la funcin de fiabilidad R(t) y la funcin de impacto H(t).
t lo que hace es recoger (para todo tj t) las estimaciones puntuales dj / nj de la
En realidad, H

funcin de riesgo, h(tj) = hj en cada instante de fallo tj y acumularlas.


A partir de la relacin logartmica entre (t) y R(t), se obtiene un estimador alternativo R t , de la

funcin de supervivencia, conocido comnmente como el estimador de Nelson-Aalen, de la funcin


de supervivencia, cuya relacin seria:
d
t
njj
R t e
e j ,t j t

Este estimador ha sido tema de discusin (para el caso de una variable continua) por parte de
diferentes autores. La conclusin es que, en el caso de que T sea una variable aleatoria continua, H t

y t son asintticamente equivalentes y con la excepcin de valores altos de t, donde las

estimaciones son ms inestables, la diferencia entre ambos ser, por general pequea. En la prctica
t es una aproximacin lineal de primer orden de la funcin H t . Aunque t es ms sencillo de

calcular, no hay razones de fondo para preferir uno u otro.


Estas estimaciones son de gran utilidad en la construccin de grficas, para evaluar la seleccin de
una determinada familia paramtrica de distribuciones, cuando se trata de modelizar la distribucin
del tiempo de vida de una unidad y realizar unas primeras estimaciones de los parmetros del modelo
seleccionado.

II.55
CaptuloII.FundamentosTericos

2.3.2.5. Estimadores de la Funcin de Fiabilidad para Datos Truncados a la Izquierda y Censurados a la


Derecha
En lo que sigue, nos planteamos el problema de obtener un estimador para la funcin de fiabilidad
R(t) = P(T > t). A partir de dicho estimador, es posible obtener estimaciones para otras funciones de
inters como son la funcin de distribucin F(t) = 1 - R(t) o la funcin de impacto (riesgo acumulado)
H(t) = -ln R(t)).
La primera referencia sobre un estimador no paramtrico de la funcin de distribucin F para datos
censurados y truncados son realizadas por Turnbull (1976), quien en su trabajo utiliza una idea sobre
autoconsistencia para construir un algoritmo que obtiene el estimador de mxima verosimilitud de F:
Las primeras propiedades del estimador de Turnbull, que resulta ser un estimador de tipo lmite
producto, al igual que los de Kaplan-Meier y Linden - Bell, con comportamiento asinttico, y con fuerte
consistencia uniforme. Las representaciones descomponen al estimador en una suma de variables
i.i.d. ms un trmino de error.
Los estimadores para la funcin de supervivencia y otras funciones, basados en muestras
censuradas a la derecha, pueden modificarse para manipular muestras truncadas a la izquierda y
censuradas a la derecha.
En esta situacin asociamos al j-simo individuo una edad aleatoria X que indica el instante de
entrada en el estudio, y un tiempo Y de fallo o censura. Como en el caso de datos censurados a la
derecha, se define t1 < t2 < ... < tk, como los diferentes tiempos de fallo, siendo dj el nmero de fallos
en el instante tj. Las dems cantidades necesarias para calcular los estadsticos en el caso de censura
a la derecha (Kaplan-Meier o Nelson-Aalen) consisten en el nmero de individuos en riesgo
inmediatamente antes del instante tj, llammosle rj. En el caso de censura a la derecha rj coincide con
el nmero de individuos que estn en estudio en el instante 0 y que tienen un tiempo de participacin
de al menos tj.
Para los datos truncados a la izquierda, redefinimos estas cantidades tr como el nmero de
individuos que entraron en estudio antes del tiempo tj y que tienen un tiempo de participacin de al
menos tj, esto es, es el nmero de individuos i, que verifican que su tiempo de fallo ti es tal que xj < ti
< tj.
Usando esta nueva definicin de rj, se puede obtener los estimadores de la funcin de fiabilidad
(por ejemplo) para el caso de datos truncados. Sin embargo, hay que tener cuidado con las
interpretaciones de esos estimadores. Por ejemplo, el estimador producto lmite de la funcin de
supervivencia (Turnbull) en el tiempo t es ahora un estimador de la supervivencia por encima de t,
condicionado a la supervivencia al menor de los tiempos de entrada X. Es decir, estimamos P(T > t/T
X)

II.56
CaptuloII.FundamentosTericos

De modo similar, el estadstico de Nelson- Aalen estima la integral de la funcin de riesgo en el


intervalo (X, t).

2.3.2.5.1. Estimador de Turnbull


Se define el estimador de la funcin de fiabilidad o de supervivencia S(t) = R(t) para el modelo de
truncamiento a la izquierda y censura a la derecha mediante la siguiente expresin:

n 1Yi t , i 1 n
1 di
S t n 1 r
i 1
1
j 1 X j Yi Yj
i 1 i

Donde di representa el nmero de fallos en el instante Yi y ri es el nmero de individuos en riesgo


inmediatamente antes de ese mismo instante. Estas cantidades se calculan como se indica en la
expresin anterior. Siendo el estimador no paramtrico de mxima verosimilitud de S(t) = R(t) bajo
este esquema muestral.
Es importante observar que el estimador de Turnbull en ausencia de truncamiento coincide con el
estimador de Kaplan-Meier y en ausencia de censura se reduce al estimador de Linden-Bell . Cuando
no hay censura ni truncamiento el estimador coincide con la funcin emprica de distribucin (FES)
El estimador de Turnbull, puede presentar serios problemas en el caso de muestras pequeas o
grandes muestras con pocos valores truncados iniciales. Puede ocurrir que di= ri en algn yi aunque
ste no sea el estadstico de mayor orden de la serie y1, y2, . . . , yn. En ese caso R t S t , para t >

yi independientemente de las observaciones que haya despus, es decir aunque estemos observando
supervivencias y fallos despus de este punto. Claramente esta situacin no es satisfactoria y es un
problema exclusivamente introducido por el caso de truncamiento, que puede inducir pocos casos de
individuos en riesgo en la cola de la izquierda.

2.3.2.5.2. Estimador de Nelson-Aalen Extendido (NAE)


El estimador de Nelson-Aalen extendido para la funcin de supervivencia en el caso de
truncamiento a la izquierda y censura a la derecha corrige el sesgo producido por la subestimacin de
la supervivencia que se ha indicado.
En presencia de censura a la derecha, se estima la funcin de riesgo acumulada H(t) mediante la
expresin:
n 1Yi t , i 1
t
H n
i 1 j 1
1X Y Y
j i j

que resulta en el estimador de Nelson para la funcin de supervivencia en la forma:


R t S t e H t

II.57
CaptuloII.FundamentosTericos

Este estimador es conocido como estimador de Nelson-Aalen o estimador de Breslow. Este


estimador se recomienda como alternativa al estimador no paramtrico de mxima verosimilitud
(NPMLE) dado que el anterior tiene el menor error cuadrtico medio con datos censurados cuando la
verdadera probabilidad de supervivencia sea al menos 0.2.
Este estimador es extendido para muestras truncadas a la izquierda redefiniendo el nmero de
individuos en riesgo que ahora se obtiene como:
n
ri j 1
1 X
j Yi Y j

es decir, introducimos en el clculo de esta cantidad la condicin dada por la variable


truncamiento.
Este estimador es denominado Estimador de Nelson-Aalen Extendido, y es recomendado frente al
estimador NPMLE, porque soluciona el problema de subestimacin dado por este ltimo cuando hay
truncamiento. Un caso extremo sera cuando di = ri, lo que llevara a R t S t 0 para todo t > y1

En cambio, R y1 S y1 e 0 . En general, como: R t S t R t S t , el problema de



1

subestimacin queda bastante "aliviado, aunque no completamente solucionado. Adems, este


estimador tiene propiedades asintticas similares al estimador NPMLE, siempre que T tenga
distribucin continua.
En resumen, el estimador de Nelson-Aalen extendido adopta la siguiente forma, para estimar el
riesgo acumulado:
n 1Yi t , i 1 di
e t
H r
n
i 1 j 1
1X Y Y
j i j
yi t i

Y esta misma expresin es la que se utiliza para estimar la funcin de supervivencia o de fiabilidad
a travs del estimador:
Re t S e t e H e t

2.3.2.6. Comparacin de Funciones de Fiabilidad


Cuando se desea comparar la supervivencia de dos o ms grupos de individuos puede utilizarse un
test estadstico global, que responda a la pregunta: Todos los grupos presentan la misma
supervivencia?
Si el p-valor asociado a ese test es pequeo, lo que nos permite suponer que no todos los grupos
son iguales, hay que plantearse una nueva pregunta: Qu grupos son distintos?
Para responder a esa pregunta debemos realizar todas las comparaciones dos a dos, con un test
estadstico apropiado, de modo que se pueda inferir, si las diferencias observadas por cada dos curvas
de supervivencia pueden ser explicadas o no por el azar.

II.58
CaptuloII.FundamentosTericos

Una amplia variedad de contrastes no paramtricos, para comparar la igualdad de dos o ms


funciones de fiabilidad con datos censurados. Los ms utilizados son:
El test de Log Rank, (tambin llamado test de riesgos proporcionales) es muy potente para detectar
diferencias cuando los logaritmos de las curvas de supervivencia son proporcionales (lo que es
equivalente a decir que los riesgos son proporcionales). Sin embargo, si las curvas de supervivencia se
cortan o se cruzan, el test Log Rank tiene problemas para detectar diferencias. En esos casos es ms
til el test de Breslow, (tambin llamado test de Gehan o test de Wilcoxon generalizado), que hace
nfasis, de forma especial, en detectar diferencias cuando las curvas se cruzan al principio; por lo cual,
este test no resulta adecuado para detectar diferencias a largo plazo. Un test intermedio entre los dos
anteriores es el test de Tarone-Ware.
La mayor parte de estos contrastes, son aproximaciones con grandes muestras a la distribucin
chi-cuadrado, con el supuesto de que la censura y el tiempo de fallo son variables aleatorias
independientes.
En relacin al estudio de la potencia de estos contrastes, en distintas situaciones (con pequeas
muestras, cuando el fallo ocurre pocas veces, etc.).
Cuando se introduce otra variable que define estratos, las comparaciones que se estudian son las
que se basen en los factores o grupos definidos por los estratos existentes. Es el caso que se presenta,
por ejemplo, cuando se compara el efecto de dos mtodos de fabricacin sobre tres lneas de
produccin.
Los anteriores contrastes sirven para comparar las hiptesis de la forma:
H0 : R1(t) = R2(t) = . . . = Rr(t)
Frente a la alternativa:
H1 : Rl(t) Rl(t)
para todo t > 0 y para al menos un par de poblaciones l, l' diferentes.
Si t1 < t2 < . . . < tk son k tiempos de la muestra formada por la unin de los individuos de las r
muestras. Si adems suponemos que, en la muestra j (j = 1, ...,r), ocurren dij fallos en ti(i = 1, ...,k) y
que nij estn en riesgo en el momento anterior a ti.
r r
Entonces, se definen di d
j 1 ij
y ni n
j 1 ij
como el total de fallos y el total de unidades en

riesgo respectivamente en las r poblaciones en el instante ti(i = 1, ...,k). De modo que, para la j-sima
poblacin el estadstico zj(t) queda bien definido por la suma ponderada:

k d
z j t i 1
w ti dij nij i j 1 , ,r
ni

Que corresponde a las diferencias entre el nmero observado de sucesos y su nmero esperado,
bajo la hiptesis nula en la muestra j-sima; donde la funcin peso w(ti) que aparece en zj(t) es

II.59
CaptuloII.FundamentosTericos

compartida por todos los r grupos y es la que regula la potencia de los distintos contrastes
anteriormente mencionados (Log Rank, Breslow, etc.)
Las zj(t), as definidas son la base del estadstico de contraste de las hiptesis anteriormente
referenciadas y que viene dado por la forma cuadrtica:

2 z1 t , ,zr 1 t 1 z1 t , ,zr 1 t

1
Donde es la matriz inversa de varianzas-covarianzas de las componentes seleccionadas. Si la
hiptesis nula es cierta, este estadstico debe seguir una distribucin ji-cuadrado con r - 1 grados de
libertad.

2.3.3. Estimacin Paramtrica


Otra filosofa de estimacin seria la estimacin paramtrica que se caracteriza en suponer que la
funcin puede modelarse por una distribucin concreta, que depende de un nmero finito de
parmetros que ser necesario estimar a partir de muestras de datos reales o simulados. Debido a
que los valores observados en este tipo de problemas (tiempos de fallo, niveles de degradacin,
resistencia de materiales, nmero de eventos (fallos) en un periodo etc. ) son positivos, la
modelizacin usualmente supone una distribucin conocida. As, es comn el empleo de
distribuciones de probabilidad como la exponencial, lognormal, Weibull, de valores extremos,
Gamma, o Poisson (sta ltima para el nmero de fallos). Existen tambin modelos paramtricos
especficos, como la relacin de Arrhenius, que permiten modelar procesos donde la duracin de un
material depende de la temperatura, que son usados en problemas de pruebas aceleradas.
La estimacin paramtrica se inicia con la realizacin del mtodo grafico donde se identificara
grficamente un modelo terico, procediendo a continuacin con la estimacin analtica puntual de
los parmetros de la distribucin elegida. El mtodo consiste en estimar, por mtodos robustos
(mxima verosimilitud, momentos, mnimos cuadrados, etc.), los parmetros caractersticos de la
distribucin, y usar su normalidad asinttica para realizar la estimacin por intervalos y los contrastes
de hiptesis del caso.

2.3.3.1. Estimacin Grfica


El primer mtodo y el ms sencillo se designa frecuentemente como el mtodo grfico, la
identificacin grfica de los datos tienen por objetivo estudiar si los datos siguen un determinado
modelo o no. Las tcnicas de estadstica descriptiva que se emplean habitualmente en la mayor parte
de las reas: Histogramas, diagramas de tallos y hojas, Box-plots, etc., no se pueden utilizar en
fiabilidad debido al problema de la censura. Por ello es preciso utilizar una serie de tcnicas especficas

II.60
CaptuloII.FundamentosTericos

que se basan en la estimacin de la funcin de distribucin. Si los datos son completos, la funcin de
distribucin de probabilidad se estima de forma inmediata. Si son censurados, se usaran los grficos
de riesgo como la alternativa a los grficos de probabilidad cuando los datos estn censurados.

2.3.3.1.1. Estimacin con Datos no Censurados


Los grficos de probabilidad constituyen un mtodo grfico para tratar de buscar una distribucin
terica (exponencial, Weibull, Gamma, etc.) que se ajuste bien a las observaciones no censuradas. Lo
que se pretende con un grfico de probabilidad es comparar una funcin de distribucin terica (f.d.
terica) con la funcin de distribucin emprica (f.d. emprica) que se obtiene a partir de las
observaciones no censuradas.
Un grfico de probabilidad muestra dos grficos superpuestos:
El de la funcin de distribucin F(t) asociada a una determinada distribucin terica (f.d.
terica)
El de una nube de puntos superpuesta a la f.d. terica. Los puntos de esta nube
representan estimaciones puntuales (y no paramtricas) de la funcin de distribucin
asociada a las observaciones de los tiempos de fallo T (f.d. emprica)
A los grficos que comparan diferencias entre la distribucin de probabilidad de una poblacin de
la que se ha extrado una muestra aleatoria y una distribucin terica o cuando se comparan la
distribucin de dos conjuntos de datos se les denomina grficos Q-Q ("Q" viene de cuantil) o grfico
Cuantil-Cuantil.
A fin de facilitar la comparacin visual entre ambas funciones de distribucin (terica y emprica),
se suelen emplear transformaciones de las variables t y F(t) de forma que la f.d. terica est
linealizada (i.e., la representacin grfica de la misma sea una recta).
Evidentemente, cuanto ms se aproxime la nube de puntos (f.d. emprica) a la recta (f.d. terica),
tanto mejor ser el ajuste. El grfico de probabilidad permite pues descartar visualmente aquellas
distribuciones tericas que, claramente, no ajustan bien a los datos, as como seleccionar otras
distribuciones que, al menos en apariencia, puedan proporcionar buenos ajustes.
En todo caso, siempre ser necesario validar la bondad del ajuste utilizando alguna tcnica ms
objetiva que la simple inspeccin visual como, por ejemplo, los contrastes de hiptesis sobre la
bondad del ajuste.
Por tanto, la Identificacin grfica de los datos se realizara de la manera siguiente:
Ordenar en forma ascendente los rangos de tiempos de fallos T.
Eleccin del modelo terico y linealizacin de una distribucin (esto implica utilizar uno u
otro tipo de papel probabilstico)

II.61
CaptuloII.FundamentosTericos

Representacin de los datos en el papel de probabilidad del modelo terico hasta que
formen una lnea recta, en caso contrario, volver al punto 2 y utilizar otra distribucin.
Estimacin de los parmetros del modelo a partir del grfico

2.3.3.1.1.1. Linealizacin de una Distribucin.


El proceso de linealizacin de la f.d. asociada a una distribucin consiste en encontrar las
transformaciones g1 y g2 adecuadas para las variables t y F(t) de modo que al representar y = g2(F(t))
vs. x = g1(t) se obtenga una recta.

2.3.3.1.1.1.1. Linealizacin de la f.d. Asociada a una Distribucin Exponencial


La f.d. asociada a una distribucin exponencial viene dada por la expresin siguiente:
F(t) = 1 - exp {-t/}
donde > 0 (escala) es el parmetro que define la distribucin. Esta funcin puede ser linealizada
(i.e., puesta de la forma: y = a + bx) como sigue:
F(t) = 1 - exp {-t/} ln (1 - F(t)) =ln (exp {-t/} ln (1 - F(t)) = -(t/)
- ln (1 - F(t)) = t/
Haciendo el doble cambio de variable se tendran las transformaciones a emplear para lograr su
linealizacin:
y = - ln (1 - F(t)) y x=t
Es posible expresar la f.d. anterior como:
y = (1/) x
y donde el parmetro de la distribucin exponencial es igual a la pendiente de la recta:
1 x
tan g
y

2.3.3.1.1.1.2. Linealizacin de la f.d. Asociada a una Distribucin Weibull


La f.d. asociada a una distribucin Weibull de dos parmetros (, ) viene dada por la expresin:
F(t) = 1 exp{-(t/)}
donde > 0 (forma) y > 0 (escala) son los dos parmetros que definen la distribucin. Esta funcin
puede ser linealizada (i.e., puesta de la forma: y = a + bx) como sigue:
F(t) = 1 exp{-(t/)} ln(1-F(t)) = ln(exp{-(t/)}) ln(1-F(t)) = -(t/) ln(-ln(1-F(t))) = ln(t/)
ln(ln(1-F(t))-1) = ln(t) - ln()
Haciendo el doble cambio de variable, se tendran las transformaciones a emplear para lograr su
linealizacin:
y = ln(ln(1-F(t))-1) x = ln(t)

II.62
CaptuloII.FundamentosTericos

Se puede por tanto expresar la ecuacin anterior como y = x - ln(). Por tanto, se concluye
que lnln[1/(1-F(t))] es una funcin lineal de ln(t), el parmetro de forma, , es la pendiente de la
recta y el parmetro de escala , est en funcin de la interseccin de la recta para t= 0 y del
parmetro de forma , por lo tanto:
x
tan g
y

El grfico probabilstico de Weibull se basa en esta relacin lineal y una manera fcil de comprobar
si unos datos se ajustan al modelo de Weibull es hacer el grfico lnln[1/(1 - F(t))] versus ln(t), donde t
son los datos ordenados y R(t) = 1 - F(t) es la funcin de fiabilidad emprica, y evala hasta qu punto
la relacin lineal es factible.

2.3.3.1.1.2. Construccin de Plantillas Especiales para Grficos de Probabilidad


La construccin del papel probabilstico o las plantillas de grfico de probabilidad asociadas a una
distribucin determinada se realizan cuando son conocidas las transformaciones g1 y g2 que linealizan
una determinada f.d. terica asociada a una distribucin, ya que es posible utilizar sus inversas para
obtener t y F(t) en funcin de x e y respectivamente, i.e.: t = g1-1(x) y F(t) = g2-1(y). Con ello, resulta
inmediato volver a etiquetar los ejes x e y a fin de que muestren los correspondientes valores de t
y F(t). Ello permitir representar, sobre estos ejes transformados, directamente los valores t y F(t).

PlantillaespecialparagrficodeprobabilidaddeWeibull

En el caso de una distribucin Weibull biparamtrica (, ), se vio que las transformaciones a aplicar
serian:

y = ln(ln(1-F(t))-1) y x = ln(t)

Deshaciendo dichas transformaciones se obtiene que:


F(t) = 1 - (exp {exp {y}})-1 y t = exp {x}
Por tanto, bastara con utilizar dichas transformaciones inversas para volver a etiquetar los ejes
indicados anteriormente. El resultado sera una plantilla como la indicada en la figura XX, sobre la cual
se representar directamente (sin transformaciones adicionales) F(t) vs. t:

II.63
CaptuloII.FundamentosTericos

Figura43.PlantillaparaGrficodeProbabilidadWeibull

2.3.3.1.1.3 Estimacin de la f.d. Emprica.


Una vez seleccionada la distribucin terica que se usar para tratar de ajustar las observaciones,
se proceder a representar la nube de puntos sobre la correspondiente plantilla de grfico de

probabilidad. Cada uno de los puntos ti ,F ti , i = 1,2,..., n, representar a cada uno de los n tiempos

de fallo observados, ti (eje x) , junto con el correspondiente valor estimado de la f.d. experimental,
F ti (eje y). El diagrama de probabilidad permitir apreciar visualmente si la nube de puntos sigue

un patrn aproximadamente lineal (lo cual favorecera la hiptesis de que la distribucin terica
seleccionada se ajusta bien a las observaciones) o, por el contrario, si sta sigue un patrn muy distinto
del lineal (lo cual permitira descartar la distribucin terica seleccionada a efectos de explicar el
comportamiento de las observaciones). A continuacin se explica un mtodo (no es el nico, aunque
s uno de los ms utilizados) que permite obtener estimaciones puntuales de la f.d. emprica, F ti , a

partir de las observaciones, ti.

II.64
CaptuloII.FundamentosTericos

EstimacinPuntual(noparamtrica)delaf.d.emprica F ti

Sean t1. t2 t3. . . tn son los n tiempos de fallo observados ordenados de menor a mayor. Para cada
punto (xi, yi) con i = 1,2,..., n , el valor xi vendr dado por la i-sima observacin ti (instante en que se
ha producido el fallo i-simo). Para estimar el valor de la coordenada yi, la cual representar el valor
estimado de F ti , existe cierta dificultad respecto a la forma adecuada para su estimacin, frente a

ello han surgido diferentes propuestas, todas ellas requieren del ordenamiento creciente previo de
los datos de falla y la asignacin de su respectiva posicin i+ dentro de este ordenamiento.

it Sugiere la existencia de un limite para



n los tiempos de fallos "F t 1"
i
t Solucin rpida al problema anterior
n 1
i
t Aproximacin al Rango medio
n 1
F t it 0.5
n F t F t 1 / 2 ,
i i 1 FAP simtrica
Aproximacin de Bernard al Rango mediano
i 0.3
t n
n k n k
n 0.4

0.5 k MR
k i
1 MR
i
n j rj
1

j 1 nj
Estimador de Kaplan Meier

donde:
i = nmero de orden de observacin
n = nmero total de observaciones

Algunos autores [ZZ] indican la propuesta ms acertada para el valor estimado f.d. emprica, F ti

mediante la relacin con la cantidad del nmero de observaciones.


it
n 50
n
i
F t t 20 n 50
n 1
it 0.3
n 20
n 0 .4
Otros autores [1, 24] indican que la aproximacin de Bernard al rango mediano es el mtodo que
proporciona el mejor rendimiento. Sin embargo, es posible usar cualquiera de los mtodos
presentados o cualquier otro de los reportados en la literatura.
La existencia de programas estadsticos (como MINITAB, SPSS, etc.) son capaces de realizar los
clculos anteriores, automatizando as el proceso de construccin de estos grficos de probabilidad.

II.65
CaptuloII.FundamentosTericos

Cuando se tengan ya representados todos los puntos (xi, yi) asociados a las observaciones, se
deber determinar visualmente una recta de manera que las desviaciones entre los datos y la recta
sean lo menores posible y decidir si el ajuste es suficiente, la cual corresponder a la f.d. de la
distribucin elegida cuyos valores de los parmetros mejor se ajusten grficamente a las
observaciones.

2.3.3.1.1.4 .Identificacin Grafica de la Distribucin de Ajuste


Si los puntos representados en el grfico estn suficientemente prximos a la recta, se dir que
siguen un patrn bastante lineal, se podra dar por bueno el ajuste de las observaciones mediante la
distribucin terica elegida (resulta conveniente prestar atencin especial a los valores de los
extremos). Como se observa en la figura 44, a modo de ejemplo, la distribucin que mejor se ajusta a
los datos es la lognormal (base e).

Figura44.ComparacinGrficaentreDistribuciones

2.3.3.1.2. Estimacin con Datos Censurados.


Si hay censura las tcnicas descriptivas bsicas no serviran. No se pueden realizar histogramas si
no se conoce la longitud final de las observaciones. El proceso de para realizar un grfico de esas
caractersticas es el mismo, pero se tendr que estimar la funcin de distribucin (o de supervivencia
que sera S(t)=1F(t)) con algn mtodo alternativo.
Los grficos de riesgo son la alternativa a los grficos de probabilidad cuando los datos estn
censurados.

II.66
CaptuloII.FundamentosTericos

La funcin de riesgo acumulada, al igual que la funcin de riesgo, no es una probabilidad. Sin
embargo, tambin es una medida del riesgo: cuanto mayor es el valor de H(t), mayor es el riesgo de
fallo en el tiempo t.

2.3.3.1.2.1. Construccin del Grfico de Riesgo (Hazard Plots).


Los pasos para la construccin del grafico de riesgo acumulado seran los siguientes:
1. Ordenar los n datos de menor a mayor, teniendo en cuenta tanto los tiempos de fallo observados
como los datos censurados, marcando stos con el signo +.
2. Asignar el rango decreciente a los datos: al valor menor le corresponder rango n, al segundo
rango n-1, y as sucesivamente.
3. Calcular el valor de riesgo emprico, nicamente para los tiempos de fallo observados:
hn= 1/rango decreciente
i
4. Calcular el riesgo acumulado Hn i h k para cada fallo.
k 1
n

5. Para cada tiempo de fallo observado dibujar el valor transformado de (ti) (i.e. Weibull: ln(ti)) en
el eje de abscisas y el valor transformado de Hn(i) (i.e. Weibull: ln(Hn(i))) en el eje de ordenadas. Los
datos censurados no aparecen en el grfico.
6. Determinar una recta de manera que las desviaciones entre los datos y la recta sean lo menores
posible y decidir si el ajuste es suficiente, la cual corresponder a la funcin de riesgo de la distribucin
elegida.
7. Estimar los parmetros grficamente a partir de la expresin linealizada. (i.e. Weibull: ln(H(t)) =
ln(t) - ln())

2.3.3.1.2.2. Estimacin Emprica de Riesgo Acumulado para Weibull


Cuando la muestra es completa, se dispondrn de n tiempos de fallo y si la muestra presenta
censura (i.e. censura tipo II), solo dispondremos de r tiempos observados y n - r tiempos censurados.
Por tanto, un estudio completo sera un caso particular del estudio censurado donde se considera
que r = n. Supongamos que se dispone de r tiempos t1, t2,..., tr ordenados de menor a mayor t(1) t(2)
. . . t(r). El estimador emprico de la funcin de distribucin seria:
n observaciones t
F t
n
con t t(r). La funcin de riesgo acumulada de una distribucin, H(t), se define como la integral de
la funcin de riesgo, es decir:
t
H t h t dt
0

II.67
CaptuloII.FundamentosTericos

La funcin de riesgo acumulada de un modelo de Weibull biparamtrico seria:



t
H t t0

y la funcin de fiabilidad o supervivencia R(t):

t


R t 1 F t e t0

Aplicando el logaritmo neperiano en la ecuacin funcin de fiabilidad R(t), considerando que la


funcin de distribucin F(t) est relacionada con la funcin de riesgo acumulada H(t) mediante la
siguiente expresin H(t) = - ln(1 - F(t)), deducimos directamente el estimador de la tasa de fallo
acumulada seria:
t ln 1 F t
H
Dado que estamos considerando una muestra censurada, no podremos estimar F(t) y H(t) de
forma completa, sino que solo podremos dar estimaciones basndonos en los r datos no
censurados. Definimos ahora el concepto de rango de T(i) como el nmero de elementos de la
muestra menores o iguales que T(i) y se denota rango (T(i)). El estimador de la funcin de distribucin
emprico tiene expresiones muy sencillas si se evala en la ordenada (ya explicadas en el apartado
Estimacinpuntual(noparamtrica)delaf.d.emprica F ti ):


rango ti

F T i
n
i 1 , ,r

En la prctica podran ser:


i i 0.3

F T i
n 1
o
F T i
n 0.4
y el estimador de la tasa de fallo acumulada seria:


H T i ln 1 F t i i 1 , ,r

Esta funcin representa el porcentaje emprico de fallos ocurridos ante el tiempo de fallo
correspondiente al rango i-simo, por lo que la tasa de fallo acumulada en la muestra ordenada
ser:
ni

H Ti ln
n
i 1 , ,r

Los pares de puntos en los ejes de coordenadas a representar serian:

lnt , lnH t
i i i 1 , ,n i 1 , ,r

Se procede a realizar la recta de ajuste para comprobar la existencia de relacin lineal y la


estimacin de los parmetros de escala y forma y , respectivamente. Para ello consideremos que

II.68
CaptuloII.FundamentosTericos

b donde a es la pendiente de la recta y b es una


la recta ajustada en el grfico es y ax
constante. Considerando que ln(H(t)) = ln(t) - ln(), se tendr:
b = ln(H(t)) = ln(t) - ln()
y at

y las estimaciones de los parmetros serian a ,con lo que la estimacin del parmetro de

forma, , que coincide con la pendiente de la recta ajustada y


x
tan g
y

y la estimacin del parmetro de escala () cuando H(t) = 1, =x.

2.3.3.2. Estimacin Puntual.


La Estimacin Puntual es el mtodo ms elemental, basado en asignar los valores obtenidos de la
muestra (estadsticos) a toda la poblacin (parmetros).
Los mtodos de Estimacin Puntual consisten en la estimacin del valor del parmetro mediante
un slo valor, obtenido de una frmula determinada. Lo ms importante de un estimador, es que sea
un estimador eficiente. Es decir, que sea insesgado (ausencia de sesgos) y estable en el muestreo o
eficiente (varianza mnima)
Si bien hay varios mtodos para determinar el estimador, el ms utilizado en la prctica es el
llamado mtodo de estimacin por Mxima Verosimilitud.

2.3.3.2.1. Estimacin por Mnimos Cuadrados (Least Squares Method (LSM))


Esta tcnica de estimacin es conocida como el mtodo de mnimos cuadrados consiste en calcular
los parmetros de la distribucin seleccionada utilizando la minimizacin de la suma de los cuadrados
de los errores. Se aplica con frecuencia en problemas de ingeniera y matemticas que a menudo no
se considera como un problema de estimacin.
Partiendo de una muestra de valores de X e Y medidos sobre n individuos (x1, y1), (x2, y2), ...,(xn, yn),
se desea estimar valores en Y segn el modelo = a + bX, donde a y b son parmetros desconocidos.
Se ha de encontrar de entre todas las rectas la que mejor se ajuste a los datos observados, es decir,
buscamos aquellos valores de a y b que hagan mnimos los errores de estimacin. Para un valor xi, el
modelo estima un valor en Y igual a i = a + bxi y el valor observado en Y es igual a yi, con lo cual el
error de estimacin en ese caso vendra dado por i = yi - i = yi - (a + bxi). Entonces se tomara como

estimaciones de a y b, que notamos por a y b , aquellos valores que hagan mnima la suma de los
errores al cuadrado, que viene dada por:
n n
2
SSE i2 yi a bxi
i 1 i 1

II.69
CaptuloII.FundamentosTericos

La solucin se obtiene por el mecanismo habitual, derivando SSE con respecto a a y b e igualando
a 0. Los estimadores resultantes serian:
SSxy
b
SSxx

a y bx

Siendo:
n n
SSxy x x y y x y nxy
i 1
i i
i 1
i i

n n
2 2
SSxx xi x x i nx 2
i 1 i 1

A la recta resultante Y a se le llama recta de regresin lineal de Y sobre X.


bX

2.3.3.2.1.1. Estimacin de Parmetros para la Distribucin Exponencial


La funcin de distribucin acumulada viene dada por:
F(t) = 1 - exp {-t/}
Aplicando logaritmos naturales en ambos lados, se tiene:
1 t
ln 1 F t ln
1 F t

1
La pendiente de la lnea producida por yi ln y xi ti representan una estimacin de
1 F ti
.
Realizando el mtodo de mnimos cuadrados en la forma que y = b x, es posible expresar la f.d.
anterior como y = (1/) x, obteniendo:
n
1 x2
i 1 i
n
b
xy
i 1 i i

2.3.3.2.1.2. Estimacin de Parmetros para la Distribucin Weibull


Para la estimacin de los parmetros de Weibull, considerando su ecuacin linealizada:
1
ln ln ln t ln

1 F t

La forma de la lnea de regresin en la forma que yi = a+ bxies obtenida considerando:


1
y i ln ln

1 F t i

II.70
CaptuloII.FundamentosTericos

donde F ti es el valor estimado f.d. emprica indicado en la seccin 2.3.3.1.3 y xi lnti . Por tanto:
n

b
xi x yi y
i 1
n 2
i 1 xi x
y

a ln y bx

Despus de obtener , se aplica a la ecuacin anterior para estimar .

2.3.3.2.2. Estimacin por Mxima Verosimilitud (Maximum Likelihood Estimator (MLE))


El mtodo de Mxima Verosimilitud, Maximum Likelihood, tiene la propiedad de seleccionar como
estimacin, el valor del parmetro que maximiza el valor de la probabilidad de la muestra aleatoria
observada. El mtodo consiste en encontrar el valor del parmetro que maximiza el valor de la funcin
de verosimilitud.
Este mtodo es muy utilizado en la prctica debido a que proporciona estimadores consistentes,
asintticamente eficientes, insesgados y normalmente distribuidos para grandes muestras.
Se expondr una explicacin de los mtodos de estimacin de mxima verosimilitud tanto para
muestras completas como para muestras con censura para la distribucin Exponencial () y para la
distribucin Weibull (, )). En el resto de los casos, se hara de forma similar para obtener los
estimadores correspondientes.

2.3.3.2.2.1. Estimacin de Parmetros en Observaciones Completas


Supongamos que t1,...,tnes una muestra aleatoria simple T de n elementos y la muestra ordenada
t(1),...,t(n), los cuales proceden de una determinada poblacin con funcin de densidad f(t), donde
= (1,... ,k)' es un vector de parmetros desconocidos que toman valores en un conjunto . La
funcin de verosimilitud para , que denotaremos por L() seria:
n
L f t
i 1
i

La funcin de verosimilitud L() se puede interpretar como una medida de lo probable que son las
observaciones registradas bajo el supuesto de que stas provienen de la distribucin terica
especificada. As, los valores de para los cuales L() es relativamente grande sern ms probables
que los valores de para los cuales la probabilidad de las observaciones es relativamente pequea.
Se tratar pues de hallar (si existe) un estimador de mxima verosimilitud, i.e., un valor del
parmetro que maximice la funcin L().

II.71
CaptuloII.FundamentosTericos

Si es un elemento de donde la funcin de verosimilitud L() alcanza un mximo, entonces


se denomina estimador de mxima verosimilitud del parmetro , que en muchos modelos de
distribucin existe y es nico. Es ms sencillo trabajar con la funcin logartmica de verosimilitud, que

tambin alcanza un mximo en . Esta funcin de log-verosimilitud tiene la expresin:


n
l ln L ln f t i
i 1

En la mayora de las ocasiones, el estimador de mxima verosimilitud se obtiene resolviendo las


k ecuaciones:

l
0 i 1,,k
i
donde i es la i-sima componente del vector de parmetros = (1,... ,k)'.

2.3.3.2.2.1 1. Estimacin de Parmetros para la Distribucin Exponencial


Dadas n observaciones independientes,t1,t2,...,tn, de una variable aleatoria T que se distribuye
segn una exponencial de media desconocida, exp(), con funcin de densidad f(t) = 1/ exp {-t/},
donde > 0 (escala) es el parmetro que define la distribucin. En este caso, la funcin de mxima
verosimilitud vendr dada por:
n
1 t 1 t 1 t 1 1
L exp 1 exp 2 exp n n exp t i
i 1

Consideraremos la funcin logartmica de verosimilitud y realizando la derivada respecto a de la


expresin e igualando el resultado a cero, se obtendr el estimador de mxima verosimilitud de :
n n
1 1
ln L n ln


i 1
ti n t
i 1
i

Por tanto, se ha de resolver la ecuacin:


n
n t 0
i 1
i

de donde se obtiene el estimador de mxima verosimilitud de :


n

t
i 1
i

n
n
siendo t el tiempo total de funcionamiento acumulado para las n observaciones.
i 1
i

II.72
CaptuloII.FundamentosTericos

2.3.3.2.2.1.2. Estimacin de Parmetros para la Distribucin Weibull


Dadas n observaciones independientes,t1,t2,...,tn, de una variable aleatoria T que se distribuye
segn una funcin Weibull (, , ), con funcin de densidad:

1 t

t

f t e t0

donde , > 0 yt 0 (forma, escala y origen) son los parmetros que define la distribucin. En
este caso, considerando el parmetro de origen = 0, la funcin de mxima verosimilitud vendr dada
por:

n 1 t
i
ti
L ,
i 1
e

Tomando logaritmos, diferenciando con respecto a y e igualando a cero, se obtienen las


ecuaciones de estimacin:

lnL n n 1 n

lnti
i 1 t
i 1
i lnti 0

n
lnL n 1


2
t
i 1
i 0

Eliminando entre las dos ecuaciones y simplificado, se obtiene:


n

t i lnti
1 1 n
i 1
n


n i 1

lnti 0
ti
i 1

Aunque no es posible obtener una solucin analticamente, podremos calcular k utilizando

mtodos iterativos numricos como el mtodo de Newton-Raphson. Una vez estimado el parmetro

de forma y usando la ecuacin:


n
lnL n 1


2
t
i 1
i 0

se obtendra una estimacin para el parmetro de escala :


n

t
i 1
i

n

2.3.3.2.2.2. Estimacin de Parmetros en Observaciones Censuradas


Para obtener observaciones sobre los tiempos de fallo de un dispositivo, se suelen llevar a cabo
tests de vida. Realizar un test de vida sobre un tipo de dispositivo concreto consiste en estudiar la

II.73
CaptuloII.FundamentosTericos

evolucin temporal -bajo unas determinadas condiciones de funcionamiento- de una muestra de


dichos dispositivos, registrando el instante en que falla cada uno de los componentes de la muestra.
En general, hay dos tipos de tests de vida, los tests con re-emplazamiento -i.e.: aquellos en los que,
de forma inmediata, los componentes que fallan son reemplazados -, y los tests sin re-emplazamiento.
Al realizar un test de vida de duracin determinada, es frecuente que ste finalice sin haber
encontrado fallados todos los dispositivos de la muestra, lo que dar lugar a la aparicin de
observaciones censuradas. En fiabilidad, el tipo de censura ms habitual es censuraporladerecha,
por lo que la discusin terica del tema se centrar en este tipo de censura.

2.3.3.2.2.2 1. Estimacin de Parmetros para la Distribucin Exponencial


Dadas n observaciones independientes,t1,t2,...,tn, de una variable aleatoria Tcon r tiempos de
vida, t(1), ..., t(r). Si t1, ...,tn tienen distribucin continua y son independientes e idnticamente
distribuidos con funcin de densidad f(t) = 1/ exp {-t/}, entoncesla funcin de verosimilitud para
una muestra con censura por derecha - tipoII (se analiza este tipo por ser el de mayor relevancia)
vendr dada por expresin:
n! nr

n r !

f t1 f tr R tr

donde r es el nmero de datos no censurados de la muestra. En el caso de la distribucin


exponencial Exp(), la funcin de verosimilitud con censura tipo II seria:
n r
n! 1 n ti tr
L
n r ! r exp exp

i 1
con lo que la funcin de log-verosimilitud seria:
n! 1 1 ti
lnL ln r ln r r n r t r
n r ! i 1

y el estimador de mxima verosimilitud del parmetro se obtiene calculando la derivada de la


anterior expresin respecto a e igualando a cero, por lo que el estimador seria:
r

t n r t
i 1
i r

r
El estimador de mxima verosimilitud para de forma genrica seria:

L

r
siendo r el nmero tiempos de vida (fallos) observados en el test y L el tiempo total de
funcionamiento acumulado, el cual vendr dado para los diferentes tipos de censura por:

II.74
CaptuloII.FundamentosTericos

L nt0 si se trata de un test con re-emplazamiento y la censura es de tipo I (i.e., por


tiempo), siendo t0 el instante en que finaliza el test.
r
L t n r t
i 1
i 0 si se trata de un test sin re-emplazamiento y la censura es de tipo I,

siendo t0 el instante en que finaliza el test.


L ntr si se trata de un test con re-emplazamiento y la censura es de tipo II (i.e., por
nmero de errores), siendo tr una variable aleatoria que representa el instante en que
falla la r -sima observacin
r
L t n r t
i 1
i r si se trata de un test sin re-emplazamiento y la censura es de tipo II,

siendo tr una variable aleatoria que representa el instante en que falla la r -sima
observacin

2.3.3.2.2.2.2. Estimacin de Parmetros para la Distribucin Weibull


Dadas n observaciones independientes,t1,t2,...,tn, de una variable aleatoria Tcon r tiempos de
vida, t(1), ..., t(r). Si t1, ...,tn tienen distribucin continua y son independientes e idnticamente
distribuidos con funcin de densidad de Weibull (, , ), vendr dada por:

1 t

t

f t e t0

donde , > 0 y t 0 (forma, escala y origen) son los parmetros que define la distribucin. En
este caso, considerando el parmetro de origen = 0, la funcin de mxima verosimilitud para una
muestra con censura por derecha - tipo II (se analiza este tipo por ser el de mayor relevancia) se
indicara por la expresin genrica:
n! nr

n r !

f t1 f tr R tr

donde r es el nmero de datos no censurados de la muestra. En el caso de la distribucin Weibull


(, ), la funcin de verosimilitud con censura tipo II seria:
nr
r 1 t i 1 t r
t i t r
n
n!
L ,
r !
n
e

e

i 1

y su funcin de log-verosimilitud seria:

n! 1 r ti r t i tr
lnL , ln r ln 1 ln
n r
n r ! i 1 i 1
El estimador de mxima verosimilitud del parmetro de forma se obtiene resolviendo la
ecuacin:

II.75
CaptuloII.FundamentosTericos

r

t lnt n r t ln t
i i r r
1 1 r
i 1
r

lnt 0
r i 1 i
ti n r Tr
i 1

y utilizando esta ltima, se obtiene que el estimador de mxima verosimilitud del parmetro escala
ser:
1
r
t n r tr

i 1 i
r

Es necesario utilizar mtodos iterativos como el Newton-Raphson para obtener las anteriores
estimaciones.
El estimador de mxima verosimilitud para de forma genrica seria:
1
L

r

siendo r el nmero tiempos de vida (fallos) observados en el test y L el tiempo total de


funcionamiento acumulado, el cual vendr dado para los diferentes tipos de censura de forma similar
al indicado anteriormente.

2.3.3.2.3. Estimacin por Momentos (Method of Moments (MOM))


Este mtodo consiste en igualar un determinado nmero de momentos tericos de la distribucin
de la poblacin con los correspondientes momentos mustrales, para obtener una o varias ecuaciones
que, resueltas, permitan estimar los parmetros desconocidos de la distribucin poblacional.

2.3.3.2.3.1. Estimacin de Parmetros en Observaciones Completas


Sea,t1,t2,...,tn, es una muestra aleatoria simple T de n elementos, de una distribucin con funcin
de densidad f(t; 1, 2). Para este caso de 2 parmetros, se tomara los dos primeros momentos
respecto al origen:

1 n

n i 1
ti
t.f t ;1 , 2 dt

1 n 2
ti t 2 .f t ;1 , 2 dt
n i 1

Por tanto genricamente un estimador insesgado y estable para el momento al origen kth seria:
n
k
t
i 1
i
mk
n

II.76
CaptuloII.FundamentosTericos

donde mk representa la estimacin de mk.

2.3.3.2.3.1.1. Estimacin de Parmetros para la Distribucin Exponencial


En el caso de una distribucin exponencial, el nico parmetro es recproco de la media de la
distribucin. Por tanto, como la media de la muestra es una estimacin de la media de la poblacin,
su recproco es tambin una estimacin de . Es decir:
n

t
i 1
i

n
lo cual es lo mismo que el estimador de mxima verosimilitud indicado anteriormente.

2.3.3.2.3.1.2. Estimacin de Parmetros para la Distribucin Weibull


En una distribucin de Weibull, con una distribucin con funcin de densidad:

1 t

t

f t e t0

los kth momentos respecto al origen serian:
k

1 b k
k 1

donde sera la funcin Gamma:

s x s1e x dx s0
0

Considerando la expresin anterior de k, se puede expresar el primer y segundo momento como:


1

1 b 1
m1 k 1

2 2

1 b 2 1
k2 k2
m2 1 1


Dividiendo m2 por el cuadrado de m1, se obtiene una expresin en funcin de :

2 1
1 2 1
k2


k2
1
2 1

Realizando la raz cuadrada, se obtiene el coeficiente de variacin CV:

II.77
CaptuloII.FundamentosTericos

2 1
1 2 1

CV
1
1

A continuacin se realizara una tabla para varios CV usando la expresin de CV para diferentes
valores de . Para la estimacin de y , es necesario calcular el coeficiente de variacin (CV)d de los
datos de la muestra. Una vez hecho esto, se compara el (CV)d con el CV utilizando la tabla. El

correspondiente estimador de sera El parmetro de escala puede entonces estimarse

mediante la siguiente expresin:





x

1 1


donde x es la media de los datos.

2.3.3.2.3.2. Estimacin de Parmetros en Observaciones Censuradas


Intuitivamente, no se esperara que se pudiera utilizar una estrategia de estimacin basada en
momentos con datos censurados. Se ha sugerido un mtodo heurstico para la construccin de
expresiones de estimacin basadas en momentos, este se basa en la sustitucin del tiempo esperado
de recurrencia hacia delante para el resto de vida de las unidades de prueba que todava no han
fallado. El conjunto de datos est integrado por los r tiempos observados de fallo t(i). Adase a estos
valores los n-r valores t(r)+E[t+], para los que se ha demostrado que es independientemente de la
distribucin de vida.

E t
2
2
2

2.3.3.2.3.2.1. Estimacin de Parmetros para la Distribucin Exponencial


Utilizando la expresin general para la distribucin exponencial, se tendra que:
E t

Aplicando la expresin anterior a los datos exponenciales de vida, se obtendra que:


r r

i 1

n t i n r t r t i n r tr n r
i 1
siendo la solucin la misma que la dada en la ecuacin de estimacin de parmetros en
observaciones con censura por derecha - tipoII para mxima verosimilitud:

II.78
CaptuloII.FundamentosTericos

t n r t
i 1
i r

r

2.3.3.2.3.2.2. Estimacin de Parmetros para la Distribucin Weibull


Utilizando nuevamente la expresin general para la distribucin Weibull, se tendra que:

2
1

E t 1
1 1
2 1

La definicin correspondiente para la distribucin Weibull es un poco ms complicada. En este


caso, las dos ecuaciones serian:
1

1 b 1
k 1

1
2 2 1 2
1 1
k

k 1
2 1

se resuelven simultneamente para y . Para hacer esto, los momentos de la muestra basados

en los datos se utilizan en el lado izquierdo de las ecuaciones, y el valor t(r)+E[t+] se utiliza para los
puntos de datos censurados. La sustitucin dara la expresin:

2
1

E t 1
1 1
2 1

se utiliza para que las ecuaciones se expresen en funcin de las dos estimaciones desconocidas y
de los valores de los datos conocidos. El proceso de esta estimacin es simple. El lado izquierdo de la

expresin para k k seria:


1
2 2
1 r 1 r 2

n 1 2

t i n r t r E t ti n r t r E t
i 1 n i 1
k

k 1 r

t i n r t r E t
n i 1

No obstante, el proceso es abordable y permite el clculo de expresiones de estimacin de
momentos, que no podran obtenerse de otra forma.

II.79
CaptuloII.FundamentosTericos

2.3.3.3. Estimacin de parmetros por Intervalos de Confianza


A diferencia de lo que ocurre con la estimacin puntual, la estimacin por intervalos ofrece
informacin sobre la exactitud de la estimacin (i.e., sobre la diferencia entre el valor real y el
estimado). Ello es debido a que el intervalo de confianza en su caso ideal debe de tener dos
propiedades: que contenga el valor del parmetro objetivo con una alta probabilidad (nivel de
confianza) de que est contenido el verdadero valor del parmetro y adems que sea lo ms estrecho
posible. El intervalo se encuentra en funcin de las mediciones de la muestra y es por esa razn que
vara de manera aleatoria en uno o en ambos de sus extremos. Se definirn los siguientes conceptos
LmitedeConfianza
Es la probabilidad de que el verdadero valor del parmetro estimado en la poblacin se
site en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-),
aunque habitualmente suele expresarse con un porcentaje ((1-)100%). Es habitual tomar
como nivel de confianza un 95% o un 99%, que se corresponden con valores de 0,05 y
0,01 respectivamente.
Valor
Tambin llamado niveldesignificacin. Es la probabilidad (en tanto por uno) de fallar en
nuestra estimacin, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-).
Por ejemplo, en una estimacin con un nivel de confianza del 95%, el valor es (100-
95)/100 = 0,05. El nivel de significacin es un concepto estadstico asociado a la verificacin
de una hiptesis.

2.3.3.3.1. Estimacin General


Sean n observaciones independientes,t1,t2,...,tnde una muestra aleatoria de una distribucin que
depende de un parmetro . Se supone que existe una funcin T(t1,t2,...,tn, ) (es decir, una funcin
de la muestra y del parmetro) cuya distribucin es conocida y no depende de ni de ningn otro
parmetro desconocido. Entonces, como la distribucin de T es conocida, se pueden hallar dos valores
a y b tales que:
P( a T(t1,t2,...,tn, ) b) = 1 -
A partir de esta expresin, si T es una funcin montona de , es posible despejar de la expresin
anterior y obtener un intervalo de confianza para . La funcin T(t1,t2,...,tn, ) se denomina pivote.

2.3.3.3.1.1. Estimacin de Intervalo en Observaciones Completas


Se ver el caso de la estimacin de intervalo de confianza para la media de una distribucin
Exponencial.

II.80
CaptuloII.FundamentosTericos

EstimacindeIntervaloparalaDistribucinExponencial
Se supone que t1,t2,...,tn es una muestra aleatoria de una distribucin exponencial de parmetro
, ti ~ (1/). Se conoce que E(ti) = , luego la media muestral ti/n es un estimador insesgado y
consistente de . Para obtener un intervalo de confianza para es necesario recordar que la suma de
variable aleatoria exponenciales independientes es una variable aleatoria con distribucin Gamma, es
decir:
n
1
t n,
i 1
i

1 1
Adems si V , y a > 0 entonces aV , . Luego:
a
n
2
t 2
i 1
i 2n

n
2
La funcin
i
2
t depende del parmetro de inters y cuya distribucin es conocida como 2n
i 1

permite construir el intervalo de confianza para .


Luego, para cualquier (0,1):
n
2
P 2 t i
2
1
2n ,
2
i 1
2 n ,1
2
o equivalentemente:
n n

2
i 1
t i 2 ti


2 i 21 1
2 n ,1
2n ,
2 2

Luego, un intervalo de 100(1-)% de confianza para la media de una distribucin Exponencial
seria:
n n

2
i 1
t i 2 ti


2 , i 21

2 n ,1
2n ,

2 2

n
donde t
i 1
i es el tiempo total de funcionamiento observado para los ndispositivos considerados

y p2 g es el percentil de orden p en una distribucin 2 (Chi-cuadrado) con g grados de libertad

(i.e., es aquel valor que, en una 2 con g grados de libertad, deja a su izquierda un rea p)

II.81
CaptuloII.FundamentosTericos

2.3.3.3.1.2. Estimacin de Intervalo en Observaciones Censuradas


Se analizaran los casos de la estimacin de intervalo de confianza para la media de una
distribucin Exponencial con censura tipo II y I.

2.3.3.3.1.2 1. Estimacin de Intervalo para la Distribucin Exponencial con Censura Tipo II


n
2

En el caso de censura de tipo II (por nmero de fallos), la cantidad i t se distribuye segn una
i 1

2 (Chi-cuadrado) con 2r grados de libertad, lo que permite obtener los correspondientes


intervalos de confianza. En efecto, segn lo dicho:

n
2
P 2 t i
2
1
2r ,
2
i 1
2 r ,1
2

Equivalente a:

n n

2
i 1
t i 2 ti


2 i 21 1

2r ,1
2r ,

2 2

con lo que el intervalo buscado para , a un nivel de confianza (1 )%, viene dado por:

n n


2 ti 2 t i
i 1


2 , i 21
2 r ,1 2 r ,
2 2

El intervalo anterior es una generalizacin del visto para el caso de observaciones completas. Ello
no es de extraar si se tiene en cuenta que las observaciones completas se pueden interpretar como
un caso particular de observaciones censuradas de tipo II (en concreto, cuando n=r).

2.3.3.3.1.2 2. Estimacin de Intervalo para la Distribucin Exponencial con Censura Tipo I


En el caso de la media con censura de tipo I (por tiempo), se suele utilizar el siguiente intervalo
de confianza:
n n
2
i 1
ti t
2
i 1
i

2 2

2r 2 ,1 2r ,
2 2

2.3.3.3.2. Estimacin por Mxima Verosimilitud


Para construir los intervalos de confianza basados en las estimaciones de mxima verosimilitud de
los parmetros utilizaremos la inversa de la matriz de varianzas-covarianzas que corresponde con la

II.82
CaptuloII.FundamentosTericos

matriz de informacin de Fisher, La matriz de informacin de Fisher para un estimador de mxima

verosimilitud del parmetro seria:


2 l

que es una matriz cuadrada con dimensiones k x k. Cada elemento de la matriz es el opuesto de la
segunda derivada parcial de la funcin de log-verosimilitud evaluada posteriormente en los
estimadores de mxima verosimilitud del modelo de distribucin correspondiente. La inversa de la

matriz de informacin de Fisher seria la matriz de varianzas-covarianzas del vector aleatorio :


1
2l
Var

Los elementos diagonales de esta ltima matriz se corresponden con las varianzas de los
estimadores de mxima verosimilitud de cada componente del parmetro.

EstimacindeIntervaloparaladistribucinWeibull
Basndose en la teora general del mtodo de mxima verosimilitud, se puede suponer que T es
una variable aleatoria con distribucin Weibull (, ) y que los estimadores de mxima verosimilitud

de los parmetros de la distribucin, y , sern los obtenidos de las expresiones:


n

t i lnti
1 1 n
i 1
n


n i 1

lnti 0
ti
i 1

n

t
i 1
i

n
Entonces se pueden estimar las caractersticas de fiabilidad y los intervalos de confianza.
Una caracterstica de los estimadores de mxima verosimilitud es que son asintticamente

normales, es decir, que s y son los estimadores de mxima verosimilitud de los parmetros

forma y escala de la distribucin Weibull (, ), es decir, para muestras de tamao grande:


N , Var
N , Var
donde Var y Var
son los elementos diagonales de la matriz inversa de la matriz de

informacin de Fisher evaluada en y . Por tanto, las cantidades anteriores estandarizadas serian:

II.83
CaptuloII.FundamentosTericos


N 0 ,1 N 0 ,1
Var
Var

Los intervalos de confianza (1 - ) % bilaterales basados en las expresiones anteriores serian de la


forma:



z Var , z Var z
Var , z
Var
2 2 2 2

donde z es el cuantil de la distribucin normal estndar, que esta tabulado y


Var y
2



Var son las races cuadradas de las estimaciones de los elementos diagonales de la matriz de

varianzas-covarianzas.
1
2l
Var

El clculo de las varianzas de y es complejo, ya que involucra el clculo de la inversa de la

matriz de derivadas segundas del logaritmo de la funcin de verosimilitud. La mayora de programas


estadsticos sobre fiabilidad disponen de rutinas que calculan estas varianzas. Puede utilizarse
tambin las siguientes expresiones que dan una aproximacin aceptable:
2
0.6079 1.1087
Var 2
Var
n n

La estimacin de la fiabilidad en un momento t0, o un percentil de la distribucin de Weibull se

obtiene mediante un simple clculo. Si se disponen de los estimadores de mxima verosimilitud y

, la fiabilidad estimada en t0 seria:



t
0

R t0 e
y la estimacin del percentil p:
1
t p ln 1 p

Los estimadores obtenidos de la fiabilidad y del percentil son tambin mximo verosmiles gracias
a la propiedad de invariancia funcional de los estimadores de mxima verosimilitud.

II.84
CaptuloII.FundamentosTericos

2.3.3.3.3. Estimacin por Mnimos Cuadrados


Obtenida la recta de regresin lineal mnimo-cuadrtica Y a , podemos decir con un (1-)
bX
100% de confianza que cuando x=X, el valor medio estimado en y se encontrara en el siguiente
intervalo:
2
1 X X
Y t sR
1 ,n2
2
n SXX

y que cuando x=X, el valor predicho en y, se encontrara en el intervalo siguiente


2
1 X X
Y t sR 1
1 ,n 2
2
n SXX

donde
t1-/2,n-2 = t-Student con n-2 grados de libertad que deja a su izquierda un rea de 1 - /2.
sR =Varianza residual del modelo.
SXX = nX2

2.3.4. Contraste de Hiptesis


Uno de los aspectos ms importantes en cualquier tratamiento de datos es el contraste de
hiptesis. El contraste de hiptesis (tambin denominado test de hiptesis o prueba de significacin)
es un procedimiento para juzgar si una propiedad que se supone en una poblacin estadstica es
compatible con lo observado en una muestra de dicha poblacin.
La base de los planteamientos de contraste es formular una hiptesis y determinar si es verdadera
o falsa. Existen dos tipos de hiptesis:
La hiptesis nula (H0). Es la hiptesis bsica que se formula y se quiere contrastar y, por
tanto, es la hiptesis que se acepta o se rechaza.
La hiptesis alternativa (Ha). Es distinta de H0 e incompatible con ella. Puede haber varias
hiptesis alternativas, y se elige la ms adecuada a partir de la informacin disponible.

2.3.4.1. Estadstico de Contraste


Una vez planteada la hiptesis tenemos que elegir el estadstico de contraste ms apropiado, el
cual es una variable aleatoria que seguir una funcin de probabilidad y para cada muestra de datos
tomar un determinado valor, que al compararlo con los valores crticos de esa funcin de
probabilidad, nos permitir aceptar o rechazar la hiptesis nula.

II.85
CaptuloII.FundamentosTericos

2.3.4.2. Tipos de Errores


Existen dos tipos de errores:
El errortipoI es el que cometemos cuando rechazamos la hiptesis nula siendo verdadera.
Su probabilidad se representa generalmente por y se conoce como niveldesignificacin.
El valor mximo que se le suele dar a es 0,05, lo cual significa que rechazamos un 5% de
las veces la hiptesis nula siendo cierta. Se puede fijar un valor de a ms bajo, como por
ejemplo 0,001 o 0,005, pero el problema es que aumentamos la probabilidad de cometer
el siguiente tipo de error.
El errortipoII es el que cometemos cuando aceptamos la hiptesis nula siendo falsa. Su
probabilidad se representa por . Este error se tiene en cuenta determinando el tamao
de muestra necesario para garantizar el valor de prefijado. En el supuesto de que no se
tenga en cuenta el tamao de muestra necesario y, por tanto, se omita el error de tipo II,
entonces el procedimiento sesueledenominarcontrastedesignificacin, ya que solo
tiene en cuenta el error de tipo I.

El error de tipo II no se suele tener en cuenta porque, normalmente, se desconoce la informacin


necesaria para ello.
Estos contrastes estn basados en determinados estadsticos, que resumen las caractersticas del
conjunto de datos a estudio. Los contrastes comparan estos estadsticos con los valores de los
estadsticos tabulados, que dependen del nivel de significacin y si los estadsticos calculados superan
a los tabulados rechazaremos H0. Por ltimo, definiremos el p-valor, que es la probabilidad calculada
al asumir que la hiptesis nula H0 es cierta, de que el estadstico de contraste tome valores tan o ms
extremos que los calculados con la muestra sin restricciones. Si esta probabilidad es menor que
nuestro nivel de significacin, rechazaremos H0.

2.3.4.3. Tipos de Contrastes


La mayora de los contrastes de hiptesis pueden agruparse en alguno de los siguientes tipos:
El contraste de bondad de ajuste consiste en el planteamiento de hasta qu punto una
muestra se puede considerar como perteneciente a una poblacin con una distribucin
terica ya conocida.
El contraste de independencia o asociacin determina si dos caracteres X e Y de una
poblacin son dependientes o independientes.
El contraste de homogeneidad permite determinar si varias muestras tomadas de la misma
poblacin o de poblaciones diferentes se diferencian en un determinado carcter A.

II.86
CaptuloII.FundamentosTericos

2.3.4.4. Bondad de Ajuste


Para determinar si las variables se ajustan a alguna de las distribuciones de las que se han descrito
anteriormente es necesario cuantificar si los resultados obtenidos se ajustan a ese modelo o las
diferencias son debidas al azar. Los contrastes estadsticos utilizados con este fin se denominan
pruebas de bondad de ajuste. Para el contraste de hiptesis se cuenta con dos tipos de anlisis, los no
paramtricos y paramtricos.
Los anlisis no paramtricos tienen como ventaja que son de aplicacin ms general qu los
paramtricas, ya que no exige ninguna condicin sobre el tipo de distribucin. Sin embargo, son
menos sensibles a la deteccin de diferencias que las pruebas paramtricas, aunque de forma general
se puede decir que la coincidencia entre los resultados obtenidos entre las pruebas no paramtricas
y las paramtricas es superior al 90%.
Por tanto, las distintas pruebas de bondad de ajuste que existen se utilizan en funcin del tipo de
datos y la distribucin terica esperada. Una clasificacin de los ajustes ms empleados seria
Muestras categorizadas (distribuciones tanto para variables continuas como discretas).

o Test 2 de Pearson.

o Test G.
Muestras no categorizadas (distribuciones continuas).
o Test Kolmogorov-Smirnov (test K-S).
o Test de Cramr-von Misses
o Test de Anderson-Darling
o Coeficiente de determinacin R2
o Test de normalidad Shapiro-Wilk.

2.3.4.4.1. Muestras Categorizadas


2.3.4.4.1.1. Test 2 de Pearson o Chi-Cuadrado.
Se puede aplicar tanto a distribuciones continuas (con los datos previamente agrupados en clases)
como a distribuciones discretas. La utilizacin de estos mtodos se hace recomendable cuando no se
puede asumir que los datos se ajusten a una distribucin conocida. Es considerada como una prueba
no paramtrica que mide la discrepancia o distancia entre una distribucin observada y otra terica
(bondad de ajuste).
La expresin del estadstico seria la siguiente:

2

n
Oi Ei 2
i 1 Ei

donde:
Oi = Frecuencia observada de la muestra

II.87
CaptuloII.FundamentosTericos

Ei = Frecuencia esperada segn la distribucin terica


n = cantidad de intervalos

Cuanto mayor sea el valor de 2 , menos verosmil es que la hiptesis sea correcta. De la misma

forma, cuanto ms se aproxima a cero el valor de chi-cuadrado, ms ajustadas estn ambas


distribuciones.
Para calcular el valor de Chi-Cuadrado se realiza lo siguiente:
Se divide la muestra de datos en intervalos y se obtienen la frecuencias observada para
cada intervalo (Una buena aproximacin para la cantidad de intervalos necesarios puede
ser como es el tamao de la muestra).
Se calcula la frecuencia esperada para cada intervalo basados en la funcin distribucin de
probabilidad o acumulada.
Con la frmula del estadstico se obtiene el valor de Chi-Cuadrado

Finalmente, con el valor de 2 se verifica que sea menor o igual al valor obtenido de las

Tablas de Distribucin Chi-Cuadrado

2.3.4.4.1.2. Test G (Razn de Verosimilitud)


Este test es muy similar al test 2 ya que se usa tambin para cuantificar diferencias entre valores

esperados y observados con la hiptesis nula de que nuestra distribucin de datos se ajusta a una
distribucin ya conocida. Adems, los grados de libertad se calculan del mismo modo y el valor de

contraste del test se obtiene a partir de la tabla 2 .Se recomienda la utilizacin del test G cuando las

diferencias entre frecuencias observadas y esperadas son superiores a las frecuencias esperadas y, al

igual que el test 2 , no se debe utilizar cuando hay pocos datos.

La frmula que se aplica seria:


n
oi
G 2 o ln E
i 1
i
i

Del mismo modo que en el test anterior, se busca en la tabla 2 el valor crtico con los v y el nivel

de significacin determinados y si 2 critico es mayor que G se acepta la hiptesis nula de que los

datos se ajustan a la distribucin esperada.

Debido a que el ajuste a una distribucin 2 del estadstico G no es exacto, el valor obtenido se

corrige mediante la siguiente correccin:


G
Gadj
a2 1
1
6n a 1

II.88
CaptuloII.FundamentosTericos

donde n es el nmero de datos y a las categoras en las que estn clasificados.

2.3.4.4.2. Muestras no Categorizadas


2.3.4.4.2.1. Test de Kolmogorov-Smirnov
Se puede usar tanto para muestras grandes como pequeas. Es un test muy conservador que se
aplica a variables continuas. Este test se basa en la diferencia entre la Funcin de distribucin
cumulativa y la Funcin de distribucin emprica. La discrepancia obtenida entre la funcin de
distribucin terica de la emprica da como resultado la distancia de Kolmogorov-Smirnov y con esta
se puede determinar si la hiptesis se acepta o se rechaza.
Claramente, la prueba de Kolmogorov-Smirnov se plantea de la siguiente forma
Se plantea la hiptesis nula:
o H0 = Los datos tienen por funcin de distribucin a F0
o Donde F0 es la funcin de distribucin de una ley continua dada
Se define la funcin de distribucin emprica:

0 para x X1

i
F x para Xi x X i 1
n
1 para x X n

Se plantea la distancia de Kolmogorov-Smirnov, realizando restas por encima y por debajo
de la funcin entre la funcin de distribucin acumulada y la funcin de distribucin
emprica:

i i 1

i 1 ,,n
n

DKS F0 ,F max F0 Xi , F0 Xi
n

donde F0(x) es la funcin de distribucin acumulada
Finalmente, una vez obtenida la distancia de Kolmogorov-Smirnov se verifica que dicha
distancia sea menor o igual a la Distribucin del estadstico de Kolmogorov-Smirnov:

DKS Dn
Si y solo si esta condicin se cumple, se puede decir que se cumple la hiptesis nula H0

2.3.4.4.2.2. Test de Cramr-von Misses


Es un test que se basa como el anterior, en las diferencias entre la funcin de distribucin
acumulativa F0 y la funcin de distribucin emprica. El estadstico de contraste seria:
2
Wn2 n F t F t

0 dF0 t
Si se trabaja con muestras ordenadas, el estadstico de contraste seria:
2
1 1 n 2i 1
Wn2 2

12n n i 1

F0 T i
2n

II.89
CaptuloII.FundamentosTericos

Los valores crticos estn tabulados y rechazaremos H0 para valores grandes del estadstico Wn2.

2.3.4.4.2.3. Test de Anderson-Darling


Este test tambin est basado en las diferencias entre la funcin de distribucin acumulativa F0 y
la funcin de distribucin emprica. Es una generalizacin del test de Cramr- von Misses. El
estadstico de este test seria:
2

An2 n
F t F t
0
dF0 t
F
0 t 1 F0 t
Los valores crticos estn tabulados y rechazaremos H0 para valores grandes del estadstico An2.
Por tanto, el estadstico dar una medida de lo alejadas que se encuentran las observaciones de la
recta que representa la funcin de distribucin. Cuanto mejor sea el ajuste, tanto menor ser dicho
estadstico. Estos tres ltimos contrastes solo son vlidos cuando trabajamos con muestras
completas. Para trabajar con datos censurados se pueden obtener los valores crticos utilizando
tcnicas de remuestreo.

2.3.4.4.2.4. Test de Normalidad de Shapiro-Wilk


Es la prueba ms recomendable para testar la normalidad de una muestra, sobre todo si se trabaja
con un nmero pequeo de datos (n < 30).
Se basa en medir el ajuste de los datos a una recta probabilstica Normal (Figura 45). Si el ajuste
fuera perfecto los puntos formaran una recta de 45 (frecuencia observada igual a frecuencia
esperada). El estadstico de contraste se expresa por medio de la siguiente ecuacin:
2
1 h
W n
2

a j ,n x n j 1 x j

j j 1
x
j 1

donde n es el nmero de datos, xj es el dato en orden ascendente de muestra que ocupa el lugar j,
es la media, h es n/2 si n es par o (n-1)/2 si n es impar y aj,n es un valor tabulado.

Figura45.FrecuenciasEsperadasyObservadasdeunaMuestraconlalneadeajusteaunadistribucinNormal.

II.90
CaptuloII.FundamentosTericos

Una vez calculado el estadstico W se contrasta con un valor W crtico para el nivel de significacin
elegido. Como este estadstico mide el ajuste a una recta y no la distancia a la distribucin Normal, la
hiptesis nula se acepta cuando el valor W es superior al valor de contraste tabulado (valor de ajuste
muy alto).

2.3.4.4.2.5. Coeficiente de Determinacin R2


En una estimacin por mnimos cuadrados (Least Squares Method (LSM)), la cuantificacin de la
bondad del ajuste de un modelo, lineal o no, se indica mediante elcoeficientededeterminacinlineal
R2, que podra ser definido como el porcentaje que, de las variaciones de Y, explica las variaciones de
X a travs del modelo estimado.
2 2
SRy Sxy
R2
Sy2 Sx2 Sy2

Al ser un porcentaje, el valor de R2 estar comprendido entre cero y uno, dando lugar a las

siguientes situaciones extremas como se observa en la figura 46:

Si R2 = 0 S R2y = 0 ; S x2y =0 b= 0 y a = Y . El modelo no explica nada. No existe relacin lineal

entre las variables. La especificacin del modelo podra sustituirse por: Yi = + ei, i = 1, ... ,n siendo

su estimacin: Yi Y ei , i = 1, ... ,n

Si R2 = 1 S e2y = 0 ei= 0, i = 1, ... ,n . El ajuste es perfecto. Los datos revelan una relacin lineal

exacta entre las variables.

Si la relacin entre x e y es marcadamente lineal, entonces R2 estar muy prximo a 1. Si no

existe relacin lineal entre las variables entonces R2 estar muy prximo a cero.

Figura46.RelacinentrexeyvaloresdeR2

II.91
CaptuloII.FundamentosTericos

Este coeficiente es muy importante, pues determina qu porcentaje (en tantos por uno) de la
varianza de la variable dependiente es explicado por el modelo de regresin.

En general, se pueden clasificar los valores de R2 de la siguiente forma:


Menorde0.3 0.3a0.4 0.4a0.5 0.5a0.85 Mayorde0.85
Muy malo Malo Regular Bueno Muy bueno

Adems, a diferencia de la varianza residual, este coeficiente es adimensional, esto quiere decir
que no se ve afectado por transformaciones lineales de las variables; por tanto, si se cambian las
unidades de medida, el coeficiente de determinacin permanecer invariante.

2.4. Fiabilidad en Sistemas


Hasta ahora se ha visto la fiabilidad de unidades individuales sin ver cul era su lugar en el conjunto
de la estructura de un sistema. Un sistema sera un dispositivo formado por partes cuya fiabilidad es
conocida. Estas partes se llaman componentes.
La actuacin de un sistema puede analizarse como funcin de componentes individuales. Si los
datos son recogidos en componentes individuales, entonces es posible hacer inferencia estadstica
sobre la fiabilidad de estos componentes, pero an queda el problema del clculo de la fiabilidad del
sistema a partir de la fiabilidad de sus componentes.
En general el fallo de un sistema se produce al fallar uno o varios componentes. El problema bsico
de la fiabilidad de sistemas consiste en el clculo de la fiabilidad R(t) de un sistema a partir de la
fiabilidad R1(t), R2(t),... , Rn(t) de sus componentes.

2.4.1. Sistemas Coherentes


La clase ms conocida de sistemas son los sistemascoherentes. El concepto fundamental de los
sistemas coherentes (coherent system) es que los componentes se encuentran individualmente, en
uno de los dos estados, funcionan o fallan, y el estado de los sistemas se representa en trminos de
los estados individuales de cada componente a travs de las funciones de estructura (structure
function).
Sea un sistema con n componentes. Se define X, como el estado del componente i. Donde:

1 si el componente funciona
Xi
0 si el componente no funciona
Se define , como el estado del sistema. Donde:

II.92
CaptuloII.FundamentosTericos

1 si el sistema funciona

0 si el sistema no funciona
La funcin de estructura es = (X), donde X = (x1;... ,xn) es el vector de los estados de los
componentes.
Un sistema representado por una funcin de estructura es coherente si cumple las siguientes
propiedades:
Relevancia de cada componente, es decir, no hay ninguna componente cuya fiabilidad no
afecte a la fiabilidad del sistema;
Monotonicidad, que encierra el concepto de que la fiabilidad de un sistema nunca puede
ser mejorada cuando uno de sus componentes se vuelva menos fiable.
Estas dos propiedades se pueden formular como:
El i-simo componente es irrelevante si, para todos los estados de los otros componentes
x1, ... ,xi-1, xi+1, ... ,xn el estado del sistema es el mismo, independientemente de que xi sea
0 o 1.
(x1, ... ,xi-1, 1,xi+1, ... ,xn) = (x1, ... ,xi-1, 0,xi+1, ... ,xn)
Nota: Si un componente no es irrelevante es relevante.
La monotonicidad de la funcin de estructura se refiere a la monotona de cada xi.
(x1, ... ,xi-1, 0,xi+1, ... ,xn) (x1, ... ,xi-1, 1,xi+1, ... ,xn)
Una funcin de estructura se define como un sistema coherente si es montona y cada
componente es relevante.

2.4.1.1. Sistema en Serie


Es aquel donde el fallo del sistema equivale al de un solo componente, en la figura 47 se muestra
esquemticamente y se expresa analticamente de la siguiente forma:
n
X xi
i 1

Figura47.SistemaenSerieFormadoporTresComponentes

2.4.1.2. Sistema en Paralelo


Es aquel donde se produce un fallo cuando todos los componentes fallan, en la figura 48 se muestra
esquemticamente y se expresa analticamente de la siguiente forma:

II.93
CaptuloII.FundamentosTericos

n
X 1 1 xi
i 1

Figura48.SistemaenParaleloconTresComponentes

2.4.1.3. Sistema Mixto.


Es un sistema ms general que enlaza los sistemas serie y los sistemas paralelos. En este caso el
sistema est operativo si por lo menos K componentes de entre n componentes estn operativos. K=
n corresponde a un sistema en serie y K= 1 corresponde a un sistema en paralelo.

1 xi K
X
0 xi K
El sistema 2entre3 de la figura 49 est operativo si por lo menos dos componentes de una de las
tres cadenas estn operativos. En este caso la expresin anterior debera contener la restriccin que
los componentes fueran de la misma cadena.

Figura49.Sistema2ComponentesenSerieentre3enParalelo.

2.4.2. Funcin de Fiabilidad


La funcin de fiabilidad de un sistema puede formalizarse como:
n

R t
x
X

R t 1 R t
i 1
i
xi
i
1 xi

II.94
CaptuloII.FundamentosTericos

donde los componentes son independientes y R(t) es la fiabilidad del componente i, es decir, es la
probabilidad de que el componente i-simo funcione en el instante t, y donde (X) es la funcin de
estructura que define a xi = 1 si el componente funciona y xi = 0 si no funciona.

2.4.2.1.FiabilidaddeunSistemaenSerieconTasadeFalloConstante
Si los componentes son independientes, la fiabilidad de un sistema en serie se calcula por la regla
del producto. Es decir, un sistema en serie, con los componentes independientes, funciona s y slo s
todos los componentes funcionan:
R t R1 t R2 t Rn t

Se dice que hay un sistema en serie con tasadefalloconstante cuando todos los componentes
tienen tasa de fallo constante, es decir, cuando el tiempo de vida de los componentes se distribuye
exponencialde parmetro 1/i, R t e t y por la regla del producto:

R t e t 1 e t 2 e t n

O, equivalentemente:

R t e t

donde 1 1 1 1 .
1 2 n

Un sistema en serie con los componentes con tasa de fallo constante tiene la tasa de fallo constante
e igual a la suma de las tasas de fallo.
La vida media de un sistema en serie con los componentes con tasa de fallo constante se calcula a
partir de las vidas medias i = i de sus componentes:
1

1 1 1

1 2 n
En un sistema en serie complejo,formadoporgruposdecomponentesidnticos, si el primer grupo
tiene n1 componentes con tasa de fallo 1/1, el segundo n2 componentes con tasa de fallo 1/2, etc.,
las frmulas anteriores se pueden escribir como:
n n nk
R t R1 t 1 R2 t 2 Rn t

donde la tasa de fallo del sistema seria:


1 n1 n2 nk

1 2 k

y la vida media del sistema seria:

II.95
CaptuloII.FundamentosTericos

1

n1 n2 nk

1 2 n
donde i = i las vidas medias de los subgrupos de sus componentes.
La tasa de fallo de un sistema en serie, formado por ncomponentesidnticas con tasa de fallo 1/c
seria:
1 n

c

Si los componentes no son idnticos, a veces es til considerar la tasadefalloequivalente,que


sera la que tendran los componentes de un sistema con la misma fiabilidad si fuesen idnticos. Es
igual a la media aritmtica de las tasas de fallo reales de los componentes:
1 1 1

1 1 2 n

c n

2.4.2.2. Fiabilidad de un Sistema en Paralelo


La fiabilidad de un sistema en paralelo con n componentes de fiabilidad Ri(t), i = 1, , n seria:


R t 1 1 R1 t 1 R2 t 1 Rn t
donde la probabilidad de que el sistema falle antes de un instante t seria:
Pr T t 1 R t 1 R1 t 1 R2 t 1 Rn t

Si todos los componentes son idnticos, con fiabilidad Rc(t), entonces la fiabilidad seria:
n
R t 1 1 Rc t

La fiabilidad de un sistema en paralelo, donde todos los componentes tienen tasa de fallo
constante, seria:


R t 1 1 et 1 1 et 2 1 et n
Se concluye que un sistema en paralelo, donde todos los componentes tengan tasa de fallo
constante, notienetasadefalloconstante.
En un sistema en paralelo si los componentes son idnticos, con tasa de fallo 1/c, la fiabilidad
seria:
n

R t 1 1 e t c
y la vida media puede obtenerse como:

II.96
CaptuloII.FundamentosTericos


1
c
1 1 1
1
2 3 n

1
Para n grande se puede utilizar la aproximacin c , donde es la constante de Euler:
ln n
= 0,577.

2.4.3. Redundancia
La redundancia es el principal mtodo para aumentar la fiabilidad de un sistema y se define como
la existencia de ms de un medio para realizar una determinada funcin. Estos medios no tienen por
qu ser idnticos (MIL-STD-721B).
La redundancia puede implicar el uso de dos o ms componentes o conjuntos idnticos, de forma
que cuando uno falla hay otros que realizan la funcin; o bien puede incluir medios diferentes para
realizar la funcin. Una rueda de repuesto de un automvil es un ejemplo de pieza redundante; el
sextante manual usado para la navegacin de un vehculo espacial en caso de fallo de los controles
automticos es un ejemplo del segundo mtodo.
En ambos ejemplos, el componente redundante (la rueda o el sextante) se usa slo cuando falla el
sistema primario. Este uso se llama redundanciasecuencial.
Otros sistemas redundantes se hacen funcionar simultneamente, de modo que todos los sistemas
utilizables (no fallados) realicen la funcin durante todo el tiempo. Este tipo se llama redundancia en
paralelo activo. El uso de cuatro motores en un avin es un ejemplo de redundancia en paralelo activo.
El tipo de redundancia viene impuesto ante todo por consideraciones de actuacin del sistema. La
redundancia secuencial proporciona tericamente ms fiabilidad que la redundancia en paralelo
activo si las funciones de deteccin de fallos y conmutacin son extremadamente fiables. En caso
contrario se prefiere la redundancia en paralelo activo desde el punto de vista de la fiabilidad. Ambos
tipos dan una fiabilidad del sistema mucho mejor que el sistema no redundante. Los clculos de la
fiabilidad de sistemas redundantes pueden resultar muy complicados. En esta apartado se presentan,
a ttulo de ejemplo, algunos clculos de fiabilidad de sistemas con componentes redundantes.
La norma MIL-STD-721 B define la redundanciaactiva (redundancia en paralelo activo) como la
redundancia de los sistemas en los que los objetos redundantes operan simultneamente, en lugar
de ser activados cuando son necesarios.
Y la redundanciasecuencial (standby) se define como la redundancia de los sistemas en los que el
medio alternativo de realizar una funcin no se activa hasta que es necesario, y es activado por el fallo
del medio primario de realizar la funcin.

II.97
CaptuloII.FundamentosTericos

Un ejemplo de redundancia activa sera el de un avin trimotor, que funciona siempre que
funcionen dos motores.
Consideraciones a tener en cuenta serian que, en un sistema secuencial (standby), el componente
redundante se activa mediante un interruptor que tiene su propia fiabilidad. Si la fiabilidad del
interruptor no es del 100%, se puede perder la fiabilidad ganada con la redundancia. Y adems, el
hecho de que el componente redundante no est activado mientras el otro funciona correctamente,
reduce las oportunidades de fallo. Por lo tanto, si la fiabilidad del interruptor es 100% fiable, un
sistema secuencial (standby) tiene una fiabilidad ms alta que un sistema en paralelo simple.
Para un sistema en paralelo con n componentes standby, con interruptor 100% fiable, con todos
los componentes con la misma tasa de fallo 1/, constante, la fiabilidad puede calcularse a travs de
la expresin:

t t2 t n1
Re t
1 2

2! n 1!n1
que es la expresin para un sistema con n unidades iguales y con (n-1) unidades de reserva. La
redundancia secuencial con interruptor 100% fiable requiere de menos componentes para alcanzar la
misma fiabilidad que la redundancia en paralelo activa.
Se supone que el dispositivo de deteccin de fallo no es perfectamente fiable, por lo que es preciso
tener en cuenta sus probabilidades de fallo. Si se supone que el diseo del sistema es tal que la funcin
de deteccin slo est ligada a las unidades de reserva y no afectan a la primera unidad que funciona,
entonces se incluye en la frmula la probabilidad de deteccin de fallo PSW.
En este caso, dado un sistema formado por dos componentes con tasa de fallo constante en
redundancia standby, si la activacin del componente es manual, mediante un interruptor 100%
fiable, y PSW es la probabilidad de deteccin, entonces la fiabilidad seria:

t
R t et 1 PSW

Observaciones.
Si la activacin se hace mediante un interruptor automtico con probabilidad de funcionar
p, la frmula tambin es vlida.
Si la activacin se hace mediante un interruptor automtico y la probabilidad de funcionar
es variable, se debe considerar la fiabilidad del interruptor. Cuando tiene tasa de fallo
constante 1/s, la frmula seria:



R t et 1 s et s

II.98
CaptuloII.FundamentosTericos

2.4.4. Anlisis Mediante Arboles de Fallo


La fiabilidad de redes (Network reliability) se basa en una representacin grfica abstracta de un
sistema. Bsicamente est orientada al suceso xito, pero en la prctica es mejor orientarla al fallo.
Muchas veces un rbol de fallos (o rbol lgico) es el mejor dispositivo para deducir cul es el
mayor evento que puede producir un fallo en el sistema.
El anlisis mediante rboles de fallo, abreviadamente FTA (failure tree analysis), es una tcnica que
utiliza grficos, denominados rboles de fallo, que representan con operadores booleanos ("Y" y "O")
las combinaciones de estados lgicos susceptibles de conducir un sistema a una situacin no deseada.

II.99

Captulo III. Metodologa Experimental

CaptuloIII.MetodologaExperimental

3.1 Procedimiento Metodolgico


El procedimiento metodolgico propuesto para la realizacin de este estudio seria el siguiente
tanto para Fiabilidad como Mantenibilidad:
Anlisis Descriptivo de los Datos.
Anlisis No Paramtrico (o paramtrico segn se observe en el anlisis descriptivo)
o Se obtendr la Funcin de Supervivencia (no Reparabilidad),.Funcin de
Distribucin (Mantenibilidad) y Funcin de Riesgo Acumulado (Tasa de Reparacin
Acumulada).
o Se realizara un ajuste de los Datos Tiempo-Evento a Modelos Paramtricos y se
obtendrn las funciones ms importantes
o Se realizara una estimacin no Paramtrica
Anlisis Paramtrico
o Estimacin Grafica y analtica de la distribucin terica optima a los datos
o Estimacin Grafica Paramtrica de los parmetros de la distribucin elegida.
o Estimacin Puntual de los parmetros por medio de Mnimos Cuadrados (LSM),
Mxima Verosimilitud (MLE) y Momentos (MOM).
o Estimacin de Parmetros por Intervalos mediante Mnimos Cuadrados, Mxima
Verosimilitud y Momentos.
o Se realizara un anlisis mediante el Error Cuadrtico Medio (MSE) para obtener el
mtodo de menor error para la obtencin de los parmetros.
o Se analizaran los resultados mediante test de bondad de ajuste por Mnimos
Cuadrados (ANOVA, Test de Independencia Lineal y Correlacin Lineal) y
estadsticos (Pearson o Chi-Cuadrado, Kolmogorov-Smirnov, Cramr-von Misses y
de Anderson-Darling)
o Se calcularan las expresiones matemticas y graficas de la distribucin con loas
parmetros obtenidos
Anlisis Comparativo no Paramtrico y Paramtrico de las diferentes funciones.
Simulacin, se realizara una generacin y ajuste de variables aleatorias de la Distribucin
elegida para una muestra de n = 10, 20 y 40 en 5 ocasiones cada una, realizndose al final
un resumen de los test de MSE y de las pruebas de Bondad de Ajuste

De un modo esquemtico sera similar al presentado en la figura 50.

III.2
CaptuloIII.MetodologaExperimental

Figura 50: Procedimiento Metodolgico en Fiabilidad y Mantenimiento.

III.3

Captulo IV. Resultados y Anlisis

CaptuloIV.ResultadosyAnlisis

4.1. Aplicacin Prctica


4.1.1. Introduccin
El uso de mtodos estadsticos con el fin de mejorar la calidad de productos y servicios se ha
incrementado considerablemente. Una extensin natural de lo que pas en este mundo de la calidad
se manifiesta tambin en un cambio de enfoque en la mejora de la fiabilidad y del mantenimiento. En
una forma prctica, la fiabilidad se define como "calidad a travs del tiempo". Hoy en da los ingenieros
estn convencidos de que una buena fiabilidad y un buen mantenimiento son unas caractersticas
indispensables para tener la oportunidad de competir. En este trabajo se hace un acercamiento a los
conceptos de la fiabilidad y mantenimiento desde una visin estadstica.
Este estudio est orientado a estudiar y analizar los fallos que se producen en equipos industriales,
entendiendo por fallo aquellos eventos indeseables que debemos tratar de evitar, prevenir o
anticipar, a travs del estudio de su probabilidad de ocurrencia mediante mtodos probabilsticos
automticos. Con esta finalidad, analizamos el impacto de aplicar herramientas informticas en los
estudios fiabilidad y mantenimiento, conceptualizando el mismo como aquella funcin cuyo objetivo
es la prolongacin y/o la recuperacin de las funciones de determinado componente o mquina.
La metodologa a aplicar, en este estudio probabilstico de Fallos, consistir en analizar una
muestra representativa de la poblacin, y que previo anlisis de sus datos ser estudiada con el fin de
realizar un modelo de realizar un modelo para su simulacin.
La utilizacin de software para realizar el anlisis de fiabilidad se ha vuelto imprescindible en la
prctica, pues cuando se tiene gran cantidad de informacin a manejar, realizar el anlisis sin un
ordenador sera una tarea poco tediosa. Igualmente, la utilizacin de software permite obtener
informacin precisa y confiable del modelo a estimar. Estas razones han sido la motivacin para incluir
conjuntamente con la teora la realizacin prctica del anlisis utilizando libreras estadsticas.
A lo largo de este trabajo, se definirn y desarrollan los elementos necesarios para realizar el
estudio mediante el software estadstico R. La decisin de usar esta herramienta no solo est basada
por ser un software de libre uso, sino por la coherencia presentada por las libreras accesibles y la
teora desarrollada en este trabajo, as como las opciones que ofrece para el manejo de datos y
graficar la informacin de forma precisa, contribuyendo notablemente al estudio del modelo de a
estimar al facilitar su anlisis. Sin dejar de lado su aspecto educativo, ya que lleva al usuario a trabajar
a un nivel de programacin, por lo que hace necesario el conocimiento de lo que se desea realizar.

4.1.2. Caractersticas de los datos


En este trabajo se dispondr de una relacin de tiempos de fallo y reparacin de un total de 80
dispositivos elctricos cuya unidad de tiempo ser el da, que estn indicados en el Apndice 1.

IV.2
CaptuloIV.ResultadosyAnlisis

Por la descripcin de los datos, se supone que a cada dispositivo corresponde un solo tiempo de
reparacin, que podra considerarse como de inspeccin, ya que no hay ms datos de vida despus
de la reparacin, por lo tanto se estar ante dispositivos no reparables, realizndose un estudio
completo sin censura, ya que se sabe que el estudio termina cuando han fallado todas las unidades.
Las variables aleatorias continuas tomaran los valores indicados en el apartado 2.2.2.
Disponibilidad, de tal forma que el tiempo de fallo seria el tiempo que el dispositivo estara operativo
desde su puesta en marcha hasta su parada TTF que conforman el llamado MTTF (Mean Time To
Failure) y el tiempo de reparacin como el tiempo de parada por reparacin TTR que conforman el
MTTR (Mean Time To Restoration).
Se realizaran dos estudios, uno de fiabilidad de los dispositivos mediante la muestra de tiempos de
operacin TTF y otro estudio de mantenibilidad con los datos de reparacin TTR

4.2. Anlisis Fiabilidad de tiempos de Operacin TTF


4.2.1. Anlisis Descriptivo
Para poder realizar un anlisis adecuado, es importante conocer la estructura de la poblacin con
la que se est trabajando mediante un anlisis descriptivo a para ello se utilizaran alguna medidas
centrales (media, mediana, moda), indicadores de dispersin y forma (desviacin tpica, varianza,
rango, cuartiles, percentiles, asimetra, curtosis, etc.) y finalmente graficas (histograma) para poder
realizar una aproximacin de las principales caractersticas del conjunto de datos
En el Apndice 4, se puede observar el programa realizado en R para el Anlisis Exploratorio de
datos en el apartado 2.1. En la tabla 1 se muestran los siguientes estadsticos descriptivos obtenidos:
Tabla 1. Estadsticos Descriptivos para el Tiempo Operativo TTF
# Medidas de centralizacin
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.11 4.335 19.59 55.06 77.4 351.2
> mode > range
0.68 $range
2 [1] 351.14
> quantile
0% 25% 50% 75% 100%
0.11 4.335 19.59 77.395 351.25

> # Medidas de dispersin


> var
[1] 5782.225
> sd
[1] 76.04094

> # Medidas de forma (asimetria, curtosis)


> skewness
[1] 2.185943
> kurtosis
[1] 5.038275

IV.3
CaptuloIV.ResultadosyAnlisis

De las medidas de centralizacin se puede observar que el tiempo medio fue de 55.06 das pero el
mximo tiempo operativo de un dispositivo fue de 351,25 das y el tiempo mnimo fue de 0.11 da,
siendo de 0.68 das el valor ms frecuente (2 veces) y de 19.59 el valor mediano. En el 50% de los
casos el tiempo operativo oscila entre 4.33 das y 77.39.
Los tiempos se encuentran en un rango de 351.14 das, presentando una dispersin elevada con
una varianza de 5782.22 y con una desviacin tpica de 76.04.
La elevada diferencia entre la media y la mediana x Md , reflejara un elevado grado de asimetra
hacia la derecha, teniendo la distribucin de los datos a la derecha una cola ms larga que a la
izquierda, quedando ratificado por el coeficiente de asimetra 2.186 ( 0.5 aprox. para distribucin
Simtrica). El coeficiente curtosis presenta un valor muy elevado (5.038), la distribucin ser
leptocrtica (curtosis muy elevada), presentando una alta concentracin de valores en la cola de la
distribucin ( 0.5 aprox. cuando la distribucin es Mesocrtica). Esto se pone claramente de
manifiesto en el histograma (Figura 49) con una distribucin normal.
Se obtiene informacin ms clara de las variables de inters mediante los histogramas de la figura
51 y 52, donde se presenta la frecuencia de los tiempos hasta el fallo. Se puede observar que la
mayora de los dispositivos tienen un tiempo hasta el fallo menor a 80 das (3 cuartil) y en general se
presenta el fallo los primeros 20 das (mediana), aunque hay algunas unidades que fallan entre 80 y
200 das.
La asimetra mencionada anteriormente se debe a las diferencias existentes entre los tiempos de
fallo de la mayora de los dispositivos y 5 dispositivos que tienen un tiempo operativo
extraordinariamente mayor (entre 200 y 350 das).

Figura 51: Histograma de Tiempo Operativo de los Dispositivos.

IV.4
CaptuloIV.ResultadosyAnlisis

Figura 52. Diagrama de Cajas de Tiempo Operativo de los Dispositivos.

Este ha sido el primer acercamiento a la relacin de los tiempos de operacin y su distribucin


terica, en la que hay que destacar el alto nivel de dispositivos (40 unidades) con corto tiempo de
operacin (entre 0 y 20 das), es decir una alta tasa de mortalidad infantil, pasando a continuacin a
una estabilizacin en los tiempos entre 20 y 100 das (27 unidades) y a partir de los 100 das unas
probabilidades bajas de fallo (13 unidades).
Por las grficas anteriores no se detectan irregularidades en la continuidad del posible modelo
terico, por tanto, no se aprecia zonas especiales de desgaste, aunque sera interesante un estudio
de los 5 outsiders, ya que si estos dispositivos han tenido esta vida puede ser debido a causas
especiales de algn tipo de mantenimiento preventivo o predictivo.

4.2.2. Anlisis No Paramtrico


Una vez realizado un anlisis exploratorio de los datos de tiempo operativos, se ha de aplicar
mtodos estadsticos para realizar las estimaciones de fiabilidad mediante el ajuste de algn modelo
terico.
Resulta adecuado, o incluso necesario, iniciar el anlisis con mtodos analticos y grficos que
permitan interpretar los datos obtenidos, sin la distorsin que podra causar la eleccin de un modelo
paramtrico subyacente no adecuadamente acertado.
Es por tanto, adecuado comenzar el estudio mediante mtodos no paramtricos, ya no se asume
ningn tipo concreto de modelo probabilstico para los tiempos de fallo y las funciones bsicas
(fiabilidad, riesgo), estimndose directamente de los datos. En algunos casos, estos mtodos no
paramtricos sern suficientes para realizar el anlisis de los datos. Sin embargo, en otras

IV.5
CaptuloIV.ResultadosyAnlisis

circunstancias, son un paso intermedio hacia un modelo ms estructurado (paramtrico), que permita
profundizar ms en el anlisis de las observaciones.

4.2.2.1. Funcin de Supervivencia.


El aspecto analtico fue indicado en el apartado terico 2.3.2.2.(Estimador de Kaplan-Meier (KM)
de la funcin de fiabilidad).As se indic que la estimacin del producto-lmite de S(t) para la duracin
t, es una funcin escalonada, que se calcula como el producto de uno menos el riesgo existente hasta
el perodo t:
nj d j
S t
j:t j t nj

Utilizando la normalidad asinttica de S t , se puede construir el intervalo de confianza

aproximado para S t , a un nivel del 100(1-)%:

S t Z ee S t

1
2

donde Z
es el cuantil correspondiente a la distribucin normal estndar y
1
2


ee S t Var S t
es el error estndar de estimacin del estimador KM de S(t), que se calcula
con la frmula de Greewood de la varianza del estimador KM, el cual viene dado por la expresin
2 dt
Var S t S t j:t j t
nj nj dt

En el apartado 2.2. del Apndice 4, se puede observar el programa realizado en R para el anlisis
no paramtrico con comentarios adicionales.
El estimador de Kaplan-Maier para la funcin de supervivencia es obtenido mediante la librera
Survival de R con la funcin survfit. Esta funcin en su forma ms sencilla, solo requiere un objeto de
supervivencia creado por la funcin Surv, en el cual se captura el tiempo observado de la variable y su
estado (censurado o no).
Presenta los argumentos time y event. El argumento time corresponde al tiempo desde que el
dispositivo entra al estudio, hasta que este presenta el fallo o censura. El argumento event es una
variable binaria que indica el estatus del tiempo registrado, donde, de forma predeterminada
corresponde a
0 <- si el dato es censurado
1 <- si el fallo es observado

IV.6
CaptuloIV.ResultadosyAnlisis

Debido que no se tiene informacin de datos censurados, se asumir un estudio con datos
completos. Los dispositivos han fallado en el tiempo de control y, por tanto, su estado se representara
por 1 en todos ellos.
La funcin survfit de R indicara la informacin del estimador de Kaplan-Meier para la funcin de
supervivencia(tabla 2), donde n corresponde al nmero de individuos en estudio, events corresponde
al nmero de fallos presentadas en los n individuos (por tanto, el nmero de censuras est dado por
n - events), median es el tiempo mediano antes de que se presente la falla con respecto a la curva de
la funcin de supervivencia estimada (el tiempo t tal que S(t) = .5 ), 0.95LCL es lmite inferior de una
banda estimada con un 95% de confianza para el valor de median y 0.95UCL es lmite superior de una
banda estimada con un 95 % de confianza para el valor de median (esta banda es estimada por el
mtodo ordinario).
Tabla 2. Estimador de Kaplan-Meier para el Tiempo Operativo TTF
records n.max n.start events median 0.95LCL 0.95UCL
80 80 80 80 19.6 12.8 41.5

En el caso del Tiempo Operativo TTF, se tienen 80 sujetos de estudio, los 80 presentan fallo y 0
presentan censura, el tiempo mediano antes de presentar fallo es de 19.6 y un intervalo con un 95 %
de confianza est dado en su lmite inferior por 12.8 y en su lmite superior por 41.5 (en los intervalos
de confianza obtenidos por la funcin survfit, para Inf toma el valor de 1 y -inf toma el valor de 0).
Informacin adicional se puede obtener mediante la funcin summary como se indica en la tabla
3 (en el apartado 2.1. del Apndice 4 se puede observar la tabla completa)
Tabla 3. Informacin del Estimador de Kaplan-Meier
time n.risk n.event survival std.err lower95%CI upper95%CI
0.11 80 1 0.9875 0.0124 0.96315 1
0.28 79 1 0.975 0.0175 0.94079 1
0.31 78 1 0.9625 0.0212 0.92087 1
0.63 77 1 0.95 0.0244 0.90224 0.9978
0.68 76 2 0.925 0.0294 0.86728 0.9827
0.83 74 1 0.9125 0.0316 0.85058 0.9744
1.03 73 1 0.9 0.0335 0.83426 0.9657
1.06 72 1 0.8875 0.0353 0.81826 0.9567
1.14 71 1 0.875 0.037 0.80253 0.9475
1.4 70 1 0.8625 0.0385 0.78704 0.938
1.63 69 1 0.85 0.0399 0.77175 0.9282
1.65 68 1 0.8375 0.0412 0.75666 0.9183
1.69 67 1 0.825 0.0425 0.74174 0.9083
1.73 66 1 0.8125 0.0436 0.72697 0.898
1.96 65 1 0.8 0.0447 0.71235 0.8877
1.97 64 1 0.7875 0.0457 0.69786 0.8771
2.11 63 1 0.775 0.0467 0.68349 0.8665
2.94 62 1 0.7625 0.0476 0.66925 0.8558

donde time representa el tiempo para el que se presenta la informacin (anteriormente, la


informacin se presentaba para el tiempo dado por median ), n.risk indica la cardinalidad del conjunto

IV.7
CaptuloIV.ResultadosyAnlisis

en riesgo o el nmero de individuos que continua en estudio al tiempo correspondiente, n.event


corresponde al nmero de fallos que se presentan entre cada tiempo, survival indica el valor que toma
la funcin de supervivencia estimada por el mtodo Kaplan-Meier en el tiempo correspondiente,
std.err corresponde al error estndar estimado para la funcin de supervivencia en el tiempo
respectivo (expresin de Greewood) y finalmente lower95%CI y upper95 %CI denotan el intervalo de
confianza para la funcin de supervivencia en cada tiempo como se mencion anteriormente. El tipo
de intervalo utilizado es el estndar (argumento conf.type= plain en la funcin survfit), en el caso
de observar valores fuera de lmites del intervalo, se podra ir a estimar un intervalo de confianza para
la funcin de supervivencia mediante la transformacin del valor de R t (i.e. log o log-log),

expresado en los apartados de teora 2.3.2.2.1. y 2.3.2.2.2.


En la figura 53 se muestra el estimador de Kaplan-Meier de la funcin de supervivencia con el
intervalo de confianza para los 80 dispositivos, podra ser de inters analizar los tiempos de censura,
pero este no es el caso, ya que toda la muestra fue observada.

Figura 53. Funcin de Supervivencia Estimada con Intervalo de Confianza.

Se puede analizar la evolucin de la probabilidad de supervivencia en el modelo con su respectivo


intervalo de confianza y considerar la proporcin de dispositivos que presentan fallo de los que estn
en riesgo entre cada periodo de tiempo de fallo. Se muestran 4 zonas diferencias con pendientes
diferentes, siendo la ms aguda de 0 a 20 das, una zona fuerte entre 20 y 100 das, una zona media
entre 100 y 200 das una zona de estabilizacin entre 200 y 350 das.
En la figura 54 se muestra un grfico con la comparativa de resultados de la Estimacin de Funcin
de Supervivencia mediante los mtodos de Kaplan-Meier y Nelson-Aalen.

IV.8
CaptuloIV.ResultadosyAnlisis

Figura 54. Comparativa de Mtodos de Estimacin de la Funcin de Supervivencia

4.2.2.2. .Funcin de Distribucin o de Probabilidad


La funcin de distribucin vendra representada por F(t)=1-S(t), en la figura 55:

Figura 55. Funcin de Distribucin

Se puede analizar la evolucin de la probabilidad acumulada de supervivencia en el modelo con su


respectivo intervalo de confianza y considerar la proporcin de dispositivos que presentan fallo para
un periodo de tiempo de fallo.

4.2.2.3. Funcin de Riesgo Acumulado


En la figura 56 se presenta la funcin de riesgo acumulado H(t) = - ln R(t), donde se puede apreciar
los valores que va tomando y a partir de ellos, se demuestra el carcter de funcin cercana a la
linealidad, con una pequea convexidad.

IV.9
CaptuloIV.ResultadosyAnlisis

Figura 56. Funciones de Riesgo Acumulado.

La funcin de riesgo acumulado y la funcin de supervivencia estn relacionadas para datos


continuos de la siguiente forma S(t) = exp {-H(t)}. Esto ofrece un mtodo de estimacin inmediata de
H(t) haciendo logaritmos a ambos lados H(t) = -logS(t). Un segundo mtodo de estimacin de H(t) es
usando el estimador de Nelson-Aalen y su varianza. En la figura 57 se muestra un grfico con los
resultados de la comparacin de la estimacin de la funcin de riesgo acumulado por ambos mtodos.
Se muestra una ligera diferencia desde el tiempo de fallo de 100 das que va incrementndose
paulatinamente, coincidiendo con una probabilidad de supervivencia menor de un 20% (ver figura
53).

Figura 57. Comparativa de Mtodos de Estimacin de la Funcin de Riesgo Acumulado

IV.10
CaptuloIV.ResultadosyAnlisis

4.2.2.4. Ajuste de Datos Tiempo-Evento (supervivencia) a Modelos Paramtricos


Se pueden obtener modelos paramtricos puntuales para la funcin de supervivencia, riesgo y
riesgo acumulado. Estos modelos son vlidos para un solo valor en el tiempo para el cual se va a hacer
la inferencia.
En algunas aplicaciones resulta de inters obtener estos modelos paramtricos.
Dentro de la librera flexsurv de R, est la funcin flexsurvreg que crea modelos paramtricos para
datos de tiempo hasta el suceso (supervivencia). Los datos pueden ser censurados por la derecha o
truncados a la izquierda. Diferentes distribuciones paramtricas estn disponibles para ser utilizadas.

4.2.2.4.1. Funcin de Supervivencia (Fiabilidad) S(T)


Con la funcin flexsurvreg mediante la opcin "survival" (Apndice 4, apartado 2.2.4.1.) se puede
obtener la funcin de supervivencia con una serie de funciones paramtricas, como se indica en la
figura 58

Figura 58. Funcin de Supervivencia con Modelos Paramtricos

De las 4 funciones de fiabilidad paramtricas propuestas, la funcin Weibull y Gamma seran las
que presentan un ajuste ms acentuado a la funcin de supervivencia

4.2.2.4.2. Funcin de Riesgo (Fallo) h(t)


En esta ocasin es necesaria la funcin muhaz, que estima la funcin de riesgo para datos
censurados a la derecha con la opcin "hazard" de la funcin flexsurvreg (Apndice 4, apartado
2.2.4.2.), en la figura 59 se muestra el resultado:

IV.11
CaptuloIV.ResultadosyAnlisis

Figura 59. Funcin de Riesgo con Modelos Paramtricos

Las funciones logNormal y Exponencial difieren del patrn mostrado por la funcin de riesgo,
principalmente esta ltima, ya que es conocido que la exponencial tiene una tasa de fallo constante
en el tiempo. La funcin de Weibull presenta una posicin cuasi paralela a la funcin no paramtrica
y finalmente la funcin Gamma presenta un grfico cercano e irregular con relacin a la funcin de
estudio.

4.2.2.4.3. Funcin de Riesgo (Fallo) Acumulado


En esta ocasin se utilizada la funcin flexsurvreg con la opcin "cumhaz" de (Apndice 4, apartado
2.2.4.3.), mostrndose en la figura 60 el resultado obtenido:

Figura 60. Funcin de Riesgo Acumulado con Modelos Paramtricos

IV.12
CaptuloIV.ResultadosyAnlisis

La Funcin de Weibull y Gamma seran las que presentaran un ajuste ms cercano a la funcin en
estudio. Las funciones LogNormal y Exponencial difieren de la funcin de estudio principalmente a
partir de los 100 das.
En todos los grficos se puede observar claramente la existencia de aproximacin de dos
distribuciones paramtricas (Weibull y Gamma) a los datos no paramtricos.

4.2.2.5. Estimacin no Paramtrica


Debido a que una de las distribuciones que presenta un ajuste ms adecuado es la distribucin de
Weibull, se realizara a continuacin una estimacin de parmetros de esta ltima mediante la funcin
survreg (mxima verosimilitud-MLE) que se realiza de forma escala-localizacin que es una
parametrizacin diferente a la funcin de rWeibull (paramtrica), y a menudo conduce a la confusin
por la terminologa.
scala en survreg = 1/(rweibull shape)
intercept en survreg = log(rweibull scale)
Para el log de mxima verosimilitud todas las paramtrizaciones conducen al mismo valor.
En el apartado 2.2.5 del apndice 4, se muestra su forma de clculo, obteniendo de forma resumida
los siguientes parmetros expresados en la tabla 4:
Tabla 4.Parmetros de Distribucin Weibull

Las funciones principales resultantes con los parmetros obtenidos, se muestran en las figuras 61-
63.

Figura 61. Funcin de Supervivencia o Fiabilidad Weibull Figura 62. Funcin de Riesgo Weibull

IV.13
CaptuloIV.ResultadosyAnlisis

Figura 63. Funcin de Riesgo Acumulado Weibull

Se ha podido identificar como las observaciones en el estudio no paramtricas se podran ajustar


a ciertas distribuciones paramtricas, por lo que se optara por realizar a continuacin un estudio
paramtrico, para la obtencin de la distribucin ms acertada y los parmetros que mejor se
adapten a las observaciones.

4.2.3. Anlisis Paramtrico


Una vez que las observaciones han sido analizadas por medios no paramtricos para hallar alguna
distribucin terica que se ajuste correctamente a las observaciones, ya que se parta con la
asumpcin de que no se conoca nada sobre su distribucin. Podemos a continuacin realizar un
estudio paramtrico con la informacin obtenida del anlisis anterior.
Aunque a modo educativo realizaremos el anlisis partiendo de la situacin que se hubiera decido
realizar el anlisis paramtrico directamente con la asumpcin que las observaciones se comportan
de acuerdo a alguna distribucin terica determinada.

4.2.3.1. Estimacin Grafica


Los mtodos grficos que se van a estudiar en esta seccin, tienen por objetivo estudiar si los datos
siguen un determinado modelo o no. Las tcnicas de estadstica descriptiva que se emplean
habitualmente en la mayor parte de las reas: Histogramas, diagramas de tallos y hojas, Box-plots etc.,
no se van a poder utilizar en fiabilidad debido al problema de la censura que se estudiar
posteriormente. Por ello es preciso utilizar una serie de tcnicas especficas que se basan en la
estimacin de la Funcin de Distribucin.
Al representar grficamente las funciones de distribucin (f.d.) de las diferentes distribuciones
tericas, se obtienen curvas muy similares, muchas de ellas difciles de ser identificadas a simple vista.

IV.14
CaptuloIV.ResultadosyAnlisis

Es por ello que se utilizan los grficos de probabilidad, los cuales hacen uso de escalas especiales en
los ejes, de manera que al representar la f.d. sta tenga forma lineal.
Este tipo de grficos muestran la f.d. linealizada de una distribucin terica junto con una nube de
puntos que representan estimaciones puntuales de la f.d. de T. Evidentemente, cuanto ms se
aproxime la nube de puntos a la recta que aparece en el grfico, tanto mejor ser el ajuste.
Si se lograse aproximar la distribucin de T mediante alguna distribucin terica conocida, sera
posible usar esta ltima para representar grficamente estimaciones de la funcin de distribucin
Los diagramas de cuantiles (Q-Q plots) comparan en un sistema de coordenadas cartesianas, los
cuantiles de la distribucin terica (eje X) con los cuantiles mustrales (eje Y)
En la Figura 64 se muestran diagramas de cuantiles para seis distribuciones tericas (normal,
lognormal, Exponencial, Weibull, Gamma, Poisson) de ajuste a los cuantiles de las observaciones,
estas han sido realizadas mediante la funcin "fitdistr" de R (Apndice 4, apartado 2.3.1. Anlisis
Grafico), los parmetros de la distribucin terica univariante no son fijados y realizndose su
estimacin por mxima verosimilitud.

Figura 64. Modelacin de las Observaciones con varias Distribuciones Tericas

IV.15
CaptuloIV.ResultadosyAnlisis

Se puede observar como los puntos representados en el grfico estn suficientemente prximos a
la recta presentado una distribucin Leptocrtica para las distribuciones de Weibull y Gamma, por lo
que se podra dar por bueno el ajuste de las observaciones mediante dichas distribuciones.
Se podra considerar la distribucin exponencial, pero se ha de descartar ya que esta distribucin
tiene una tasa de fallo constante y los datos aportados no siguen dicha distribucin como fue
comentada en el anlisis descriptivo.
En teora esta tcnica descriptiva debera de haber sido suficiente para realizar la discriminacin
entre la distribucin de las observaciones y las diferentes distribuciones tericas propuestas, pero a
la vista de los resultados, no es suficiente.
Por lo que se cree conveniente realizar un test analtico que ayude a tomar la decisin de la
distribucin terica ms acertada (aunque conociendo que no formara parte de este apartado de
estimacin grafica).
La idea inicial seria realizar un test de bondad de ajuste y observar el resultado del estadstico. Se
ha optado realizar el test de Kolmogorov-Smirnov mediante la funcin "fitdistr" en R (Apndice 4,
apartado 2.3.1.2. Ajuste Analtico Preliminar), se trata de un test que analiza la diferencia entre las
frecuencias relativas acumuladas de las distribuciones terica y emprica. En la tabla 5 se indican los
resultados obtenidos:
Tabla 5. Ajuste Analtico ordenado por Ks stat

distribution param1 param2 Log_Likelihood ks stat ks pvalue


[1,] "gamma" "0.516" "0.009" "-385.115" "0.077" "0.73142"
[2,] "weibull" "0.638" "40.168" "-384.966" "0.083" "0.63277"
[3,] "lognormal" "2.782" "1.922" "-388.368" "0.119" "0.20757"
[4,] "exponential" "0.018" "NA" "-400.671" "0.221" "0.00082"
[5,] "normal" "55.058" "75.564" "-459.514" "0.234" "0.00032"
[6,] "poisson" "55.058" "NA" "-Inf" "0.583" "0"

Si son observados los valores del estadstico de K-S, los cuales habra que comparar con el
establecido en la tabla K-S D0.05, 80 =1.36/80 = 0.1521 para un nivel de signicacin de 5% y una
muestra de 80 observaciones, se tendra que dado que el estadstico de las distribuciones Weibull y
Gamma son menores que el valor de la tabla (0.1521) no se puede rechazar la hiptesis de que las
observaciones sigan la distribucin terica. Por tanto, el uso del estadstico K-S o el K-S p-value no es
suficiente ((P-value mayores de 0.05 indicaran que las observaciones proviene de la distribucin
seleccionada con 95% de confianza), ya que es un test muy conservador y no indica claramente la
distribucin ptima.
Pero si analizamos los resultados ordenados en la tabla 6 para el estadstico de log verosimilitud
(no es ms que el logaritmo de la verosimilitud para la estimacin de los parmetros de una
distribucin de probabilidad mediante el "mtodo de mxima verosimilitud" (en ingls "method of

IV.16
CaptuloIV.ResultadosyAnlisis

maximum likelihood" o MLE), se observa como la distribucin que tiene un ajuste optimo seria la
distribucin Weibull.
Tabla 6. Ajuste Analtico ordenado por Log_Likelihood
distribution param1 param2 Log_Likelihood ks stat ks pvalue
[1,] "weibull" "0.638" "40.168" "-384.966" "0.083" "0.63277"
[2,] "gamma" "0.516" "0.009" "-385.115" "0.077" "0.73142"
[3,] "lognormal" "2.782" "1.922" "-388.368" "0.119" "0.20757"
[4,] "exponential" "0.018" "NA" "-400.671" "0.221" "0.00082"
[5,] "normal" "55.058" "75.564" "-459.514" "0.234" "0.00032"
[6,] "poisson" "55.058" "NA" "-Inf" "0.583" "0"

4.2.3.2. Estimacin Grafica Paramtrica


Una que se ha realizado el estudio comparativo de las observaciones con distintas distribuciones y
encontrarse la distribucin de Weibull como la ptima en el ajuste a las observaciones. A continuacin
se llevara a cabo la estimacin grfica de los parmetros del modelo propuesto. La base de estos
mtodos grficos es estimar la funcin de distribucin emprica de los datos y representarla en unas
escalas tales que si el modelo elegido es el correcto, los datos presenten un aspecto lineal. Este tipo
de herramientas grficas son aplicables tanto para muestras completas como para muestras
censuradas segn indicado en el apartado terico (2.3.3.1.1.1.2. Linealizacin de la f.d. asociada a una
distribucin Weibull).
En la actualizar los programas informticos permiten realizar este proceso de forma rpida y
sencilla. En el Apndice 4, apartado 2.3.1.3. Estimacin Grafica Paramtrica se muestra la
programacin la programacin realizada en R, obtenindose los resultados de la regresin lineal y el
grafico de probabilidad para distribucin weibulll con respecto a las observaciones.
En la figura 65 se muestra como las la nube de puntos de las observaciones con respecto a su recta
de regresin asociada sigue un patrn bastante lineal, por lo cual es coherente pensar que las
observaciones puedan seguir una distribucin Weibull, pero hay que indicar como a la izquierda de la
recta existe una cola de datos hacia abajo lo que es indicativo de la existencia de un valor en el
parmetro de localizacin y para que los clculos estuvieran ajustados habra que realizar este estudio
de forma triparamtrica. Se obviara la consideracin anterior y se seguir analizando los datos para
una distribucin Weibull biparamtrica.

IV.17
CaptuloIV.ResultadosyAnlisis

Figura 65. Grfico de Probabilidad de Weibull

Se puede observar como para un parmetro de forma = 1, que correspondera con un valor del
63.2 % de la Funcin Acumulada de Fallos (eje y), este cortara a recta de regresin en un punto que
dara un valor de Tiempo de Fallo (eje x), que sera el valor de la escala , siendo en este caso de 40
das aproximadamente.

t
1
1 e 1 1 0.632 63.2%
1
F t , , 0 1 e
e
En la figura 66, se presenta un grfico similar al anterior pero en escala diferente para poder
realizar de una forma ms sencilla el clculos de los parmetros de la distribucin, el valor de
vendra dado a travs del clculo de la pendiente de la recta, siendo este el ngulo que forma la
lnea horizontal del eje y con valor 0 y la proyeccin del valor ms elevado sobre la recta (color
verde) y la proyeccin en el eje x del punto de la lnea con y=0. Matemticamente seria =y/x=
1.5/(6-3.7)= 0.65217
Para la escala , a travs de la ordenada en el origen y considerando que =exp(-b/), b seria el
valor en el eje y para x=0, en la figura muestra un valor aproximado de -2.33, por tanto se tendr
que =exp(-b/) = exp(-(-2.3)/0.65217) = 34.0104. Por tanto, los valores de los parmetros de la
distribucin de Weibull que se ajustan a las observaciones serian
Forma = 0.65217 Escala = 34.0104.
Y la recta de regresin para esta estimacin vendra dada por y= --2.3 + 0.65217 x.

IV.18
CaptuloIV.ResultadosyAnlisis

Figura 66. Grfico de Probabilidad para obtencin de parmetros de la distribucin de Weibull

En la figura 67 se muestra un resumen de ajuste con cuatro grficas, la primera un histograma


con la curva de la funcin de densidad, una grfica con la funcin acumula de probabilidad o funcin
de distribucin de las distribuciones empicas y tericas, el Grafico Q-Q (grafico de cuantiles) y el
grafico P-P de probabilidad. En el grafico Q-Q se observa la falta de ajuste en la cola superior de la
distribucin y en el grafico P-P no se observa falta de ajuste en su parte central

IV.19
CaptuloIV.ResultadosyAnlisis

Figura 67. Grfico de ajuste a una distribucin de Weibull

Finamente, en la figura 68 se presenta una revisin de los residuos o errores del ajuste realizado.
En la grfica Residual & Fitted se observa un agrupamiento en una zona del grfico y valores
dispersos en el lado izquierdo, por lo que tanto la homocedasticidad como la linealidad podran
tener cierto problema. Mediante el Q-Q plot se puede comprobar la hiptesis de normalidad de los
residuos, los puntos no estn situados sobre la diagonal del grfico, estando bien alineados en el
lado derecho, pero no as en el izquierdo. Por lo tanto, la normalidad parece no aceptable.
En la grfica Residuals Vs. Leverag se presenta el clculo de hasta qu punto los valores predichos
para los datos se mueven si el modelo fuera ajustado sin el punto de datos en cuestin. Esta
distancia total calculada se denomina distancia de Cook, donde hay 1 punto con una distancia mayor
de 1 y otro muy cercano a 0.5.

Figura 68. Grfico de evaluacin de residuos

4.2.3.2. Estimacin Puntual


La estimacin puntual consiste en obtener, a partir de las observaciones, un valor que se
aproxime al verdadero valor (desconocido) del parmetro de inters.

IV.20
CaptuloIV.ResultadosyAnlisis

4.2.3.2.1. Estimacin por Mnimos Cuadrados


Las estimaciones mnimo cuadrticas se calculan ajustando una recta de regresin a los puntos
de un conjunto de observaciones que tiene la suma mnima de las desviaciones al cuadrado (error
de mnimos cuadrados). La estimacin de los parmetros de Weibull por este mtodo se realizara
segn se indic en la parte terica 2.3.3.2.1. y la realizacin practica de estimacin de parmetros
mediante funciones en R, (apndice 4, apartado 2.3.2.1). Los parmetros de la ecuacin de la recta
de mnimos cuadrados que relaciona la variable independiente con la variable dependiente vienen
dados como resultado de la regresin lineal por:
Coefficients:
(Intercept) X
-2.3185 0.6299
Por lo tanto, la ecuacin de la recta de mnimos cuadrados seria y= -2.31855 + 0.62988 x.
Obtenindose los siguientes valores para los parmetros despus del clculo realizado
Forma = 0.6299 Escala = 39.6759.

4.2.3.2.2. Estimacin por Mxima Verosimilitud


La funcin de verosimilitud indica la probabilidad de que la muestra observada sea una funcin
con ciertos parmetros. Por lo tanto, la maximizacin de la funcin de probabilidad determina los
parmetros que son ms propensos a producir los datos observados. Desde un punto de vista
estadstico. En el caso de distribuciones como la de Weibull con ms de un parmetro, la aplicacin
del mtodo de la Mxima Verosimilitud se complica al hecho de que en la bsqueda de los mximos
locales se deben considerar derivadas parciales con respecto a cada variable y, adems, a que el
sistema resultante de igualar las derivadas parciales a cero no es sencillo.
La estimacin por este mtodo se realizara segn se indic en la parte terica 2.3.3.2.2. y la
realizacin practica de estimacin de parmetros mediante funciones en R, (apndice 4, apartado
2.3.2.2).

4.2.3.2.2.1. Estimaciones para Observaciones Completas


Librera fitdistrplus
Se recurre a la funcin fitdist de la librera fitdistrplus de que permitir el clculo de los
parmetros a una distribucin de Weibull por mxima verosimilitud. Obteniendo la
siguiente informacin sobre los valores de los parmetros
Forma = 0.63798 Escala = 40.11665

IV.21
CaptuloIV.ResultadosyAnlisis

Librera Renext
Mediante la funcin fweibull de la librera Renext se puede calcular las estimaciones por
mxima verosimilitud de los parmetros de la distribucin Weibull para muestras
completas. Los valores de los parmetros serian:
Forma = 0.63793 Escala = 40.12060

4.2.3.2.2.2. Estimaciones para Observaciones con Censura


Mediante la funcin weibullMLE de la librera START, es posible calcular las estimaciones por el
mtodo de mxima verosimilitud de los parmetros de la distribucin Weibull y realizar las
estimaciones tanto para muestras completas como para muestras con censura tipo II.
En el caso de muestras completas el argumento si se definir como numeric(length(yi))+1, que
es el valor por defecto, pero en el caso de muestras censuradas (censura tipo II), se reordenara la
muestra con el comando sort y se definir si como c(rep(1,r),rep(0,n-r)), por lo que tendremos una
muestras ordenada con r datos no censurados y n - r datos censurados. Los valores que devuelve esta
funcin son los siguientes:
Forma = 0.63792 Escala = 40.12036

4.2.3.2.2. Estimacin por Momentos


Este mtodo obtiene los para metros de la distribucin mediante la obtencin de un cierto nmero
de momentos tericos de la distribucin de la poblacin e igualarlos con los momentos de las
observaciones.
La estimacin por este mtodo se realizara segn se indic en la parte terica 2.3.3.2. y la
realizacin practica de estimacin de parmetros mediante funciones en R, (apndice 4, apartado
2.3.2.3). Mediante la funcin pelwei del paquete lmon es posible realizar el clculo de los parmetros
de la distribucin mediante el mtodo de momentos, se ha seleccionado para el primero y segundo.
Con la indicacin de bound=000, el clculo se realiza forzando el parmetro de localizacin a 0. Los
parmetros obtenidos seran los siguientes:
Forma = 0.66048 Escala = 41.00853

4.2.3.3. Estimacin de Parmetros por Intervalos.


A diferencia de lo que ocurre con la estimacin puntual, la estimacin por intervalos ofrece
informacin sobre la exactitud de la estimacin. Ello es debido a que este tipo de estimacin
proporciona un intervalo dentro del cual hay una alta probabilidad (nivel de confianza) de que est
contenido el verdadero valor del parmetro.

IV.22
CaptuloIV.ResultadosyAnlisis

4.2.3.3.1. Estimacin por Mnimos Cuadrados


La estimacin de parmetros por intervalos se realizara segn se indic en la parte terica
(2.3.3.2.3.) y la realizacin practica mediante R, (apndice 4, apartado 2.3.3.1).
Obteniendo un valor de forma = 0.6299 y de escala = = 39.6759, teniendo los siguientes
lmites con un intervalo de confianza del 95%:
2.5% 97.5% 2.5% 97.5%
0.6042 0.6555 34.5717 45.5407

En la figura 69 se muestra la grfica de regresin lineal mnimo cuadrtica con los intervalos de
confianza y prediccin al 95% para valores originales de tiempo (rojo). Tambin estn representados
los intervalos de confianza y prediccin al 95% para nuevos valores de tiempo (extrapolados y ms
finamente/uniformemente espaciados que los datos originales) (azul). Los intervalos ms estrechos
corresponderan a los intervalos de confianza al 95% para los valores esperado de los tiempos de fallo,
mientras que los intervalos ms amplios corresponderan a los valores de las observaciones de los
tiempos de fallo. Estas diferencias son debidas a la varianza del error producida por las
perturbaciones.

Figura 69. Intervalos de Confianza y Prediccin al 95%

IV.23
CaptuloIV.ResultadosyAnlisis

4.2.3.3.2. Estimacin por Mxima Verosimilitud


El clculo de las varianzas de y es complejo, ya que involucra el clculo de la inversa de la

matriz de derivadas segundas del logaritmo de la funcin de verosimilitud. La mayora de programas


estadsticos sobre fiabilidad disponen de rutinas que calculan estas varianzas.
La estimacin por este mtodo se realizara segn se indic en la parte terica 2.3.3.3.2. y la
realizacin practica mediante R, (apndice 4, apartado 2.3.3.2).
Dentro de la librera Sim.DiffProc se encuentra la funcin Ajdweibull, que proporcionar intervalos
de confianza para el modelo Weibull, cuando se trabaje con muestras de datos no censuradas
Para unos valores de los parmetros de forma = 0.6328 y de escala = = 39.4172, teniendo los
siguientes lmites con un intervalo de confianza del 95%:
2.5% 97.5% 2.5% 97.5%
0.5272 0.7491 27.0354 56.9361

4.2.3.3.2. Estimacin por Momentos


Mediante la librera rootSolve y una aplicacin R, (apndice 4, apartado 2.3.3.3), ha sido posible la
estimacin de intervalos para los parmetros de una distribucin de Weibull con bootstraping
(10000). Obtenindose los siguientes lmites para un intervalo de confianza del 95% y con unos valores
de los parmetros de forma = 0.74994 y de escala = = 46.11194:
2.5% 97.5% 2.5% 97.5%
0.640725 0.88524 30.55838 64.14014

4.2.3.4. Comparacin de Mtodos de Estimacin de Parmetros.


Despus de haber realizado la estimacin de parmetros de Weibull mediante diversos mtodos
(mtodos grficos y analticos), sera necesario evaluar a raz de los resultados cual sera el mtodo
ms apropiado. Para comparar los tres mtodos, se utiliz la prueba MSE (Mean Squared Error)
mediante una funcin en R. (apndice 4, apartado 2.3.4). MSE se ha calculado de la siguiente forma
n
2
MSE F x F x
i 1
i i

donde

x
i
i 0.3
F xi 1 e y F xi
n 0.4
La Tabla 7 muestra los resultados de las estimaciones para los parmetros de forma y escala y el
error cuadrtico medio (MSE) para cada mtodo.

IV.24
CaptuloIV.ResultadosyAnlisis

Tabla 7.Resultados del Estudio Comparativo de Parmetros

Mtodo MSE
EstimacinNoParamtrica-(Lib.Survival-MLE)
= 0.63793 = 40.1205 0.1106877
AnlisisParamtrico
-EstimacinGraficaParamtrica
= 0.65217 = 34.0104 0.2075554
-EstimacinPuntual
1.EstimacinporMnimosCuadrados-LSM
= 0.6299 = 39.6759 0.1041902
2.EstimacinporMximaVerosimilitud-MLE
2.1.ObservacionesCompletas
2.1.1.Librerafitdistrplus
= 0.63798 = 40.11665 0.1107554
2.1.2.LibreraRenext
= 0.63793 = 40.12060 0.1106874
2.2.ObservacionesconCensura-Lib.START
= 0.63792 = 40.12036 0.1106773
3.EstimacinporMomentos-MOM
= 0.66048 = 41.00853 0.1363857

En la tabla 8, se presentan los resultados ordenados por MSE de menor a mayor. La estimacin por
LSM por mnimos cuadrados es la que presenta un menor MSE, para unos valores de = 0.6299 y =
39.6759.
Tabla 8.Resultados Ordenados del Estudio Comparativo de Parmetros

Mtodo MSE
LSM - Est. por Mnimos Cuadrados 0.10419
MLE - Obs. con Censura - Lib. START 0.110677
MLE - Obs. Completas - lib. Renext 0.110687
MLE - Est. No Paramtrica - Lib. Survival 0.110688
MLE - Obs. Completas - lib. fitdistrplus 0.110755
MOM - Est. por Momentos 0.136386
Estimacin Grafica 0.207555

IV.25
CaptuloIV.ResultadosyAnlisis

Inicialmente podra pensarse que carece de sentido que el mtodo de momentos fuera el peor
evaluado, podra haber ocurrido algn error de clculo debido a su uso o errores internos de la librera
lmon, la cual fue desarrollada para funciones de 3 parmetros, ya que tiene ms error que la
estimacin grfica. Por tanto, para los valores y la cantidad de observaciones (80) se ha propuesto
como los parmetros que provienen del estudio de mnimos cuadrados como los ms acertados para
la distribucin de Weibull.
Para poder evaluar si los mtodos y clculos han sido los acertados, se han comparado los
resultados con programas como Minitab y Statgraphics Centurion XVI , se encuentra que ambos
programas utilizan MLE y las estimaciones que se han realizado en los clculos mediante MLE son muy
similares a las ofrecidas por los programas comerciales, segn se muestra en la tabla 9.
Tabla 9.Resultados de Anlisis en Programas Comerciales

Programa Mtodo Forma Escala


Minitab MLE 0.638103 40.1287
Statgraphics Centurion MLE 0.637924 40.1205

La diferencia que se tiene con respecto a los programas comerciales, es el de disponer de


diferentes estimaciones para los diferentes mtodos y la capacidad de elegir una de ellas.
En resumen el orden de los mtodos basados en su exactitud para esta aplicacin y con las
funciones y aplicaciones realizadas en R, seria:
Mtodo de Mnimos Cuadrados LSM.
Mtodo de Mxima Verosimilitud MLE.
Mtodo de los Momentos MOM
Mtodo grfico.

4.2.3.5. Bondad de Ajuste


El test de bondad de ajuste debe ser usado con cuidado. Como para cualquier test de hiptesis
nula, el no rechazo de la hiptesis nula no implica su aceptacin. Sin embargo, est mal interpretacin
del p-value es muy comn y trae la aceptacin errnea que la ausencia de evidencia es evidencia de
ausencia. En el lado contrario, en algunos casos, especialmente en grandes conjuntos de datos, incluso
si la hiptesis nula se rechaza, una distribucin ajustada puede ser elegida como la ms adecuada
entre las distribuciones tericas para describir una distribucin emprica, si el grafico de bondad de
ajuste no muestran unas fuertes diferencias entre las distribuciones emprica y terica.

IV.26
CaptuloIV.ResultadosyAnlisis

4.2.3.5.1. Test de Bondad de Ajuste para Mnimos Cuadrados


4.2.3.5.1.1. Interpretacin de los Resultados
En la tabla 10 se indican los resultados aportados mediante diversos comandos en R. (apndice 4,
apartado 2.3.5.1). Los parmetros de la ecuacin de la recta de mnimos cuadrados que relaciona la
variable independiente con la variable dependiente vienen dados por la columna Estimate de la
tabla Coefficients. Por lo tanto, la ecuacin de la recta de mnimos cuadrados seria
y = -2.31855 + 0.62988 x
El coeficiente de determinacin (es decir, el coeficiente de correlacin al cuadrado) mide la
bondad del ajuste de la recta a los datos. A partir de los datos de la tabla, se muestra que su valor en
este caso es Multiple R-squared = 0.9684, por tanto el estadstico R2 indica que el modelo ajustado
explica 96.8% de la variabilidad en Y.
Si suponemos que los datos proceden de un modelo de regresin simple de la forma yi= 0 + 1 xi
+ i, i=1,,n, donde los errores aleatorios i son independientes con distribucin normal de media 0
y varianza 2.
Bajo este modelo,
Loserrorestpicos de los estimadores de los parmetros 0 y 1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores son 0.04360 y 0.01289
respectivamente.
La columna t value contiene el estadsticot, es decir, el cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes H0: 0 = 0 y Ha: 1
0. Los correspondientes p-valores aparecen en la columna Pr(>|t|).Puesto que el P-value es
menor que 0.05, existe una relacin estadsticamente significativa entre y=ln(-ln(1-f(t)))y
x=ln(t) con un nivel de confianza del 95.0%.
El estimador de ladesviacintpicadeloserrores aparece como Residual standard error y
su valor en el ejemplo es 0.2216
Tabla 10. Resultados de la Regresin Lineal
Residuals:
Min 1Q Median 3Q Max
-1.03046 -0.11698 0.01485 0.12625 0.45653

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.31855 0.0436 -53.18 <2e-16 ***
X 0.62988 0.01289 48.86 <2e-16 ***
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 0.2216 on 78 degrees of freedom


Multiple R-squared: 0.9684, Adjusted R-squared: 0.968
F-statistic: 2387 on 1 and 78 DF, p-value: < 2.2e-16

IV.27
CaptuloIV.ResultadosyAnlisis

4.2.3.5.1.2. ANOVA y Test de Independencia Lineal


4.2.3.5.1.2.1. Anlisis de Varianza del Modelo de Regresin Lineal
En la tabla 11 se muestra que el P-value es menor que 0.05, existe una relacin estadsticamente
significativa entre Y y X con un nivel de confianza del 95.0%.
Tabla 11. Anlisis de la Varianza de la Regresin Lineal
Analysis of Variance Table

Response: Y(RM)
Df Sum Sq Mean Sq F value Pr(>F)
X 1 117.254 117.254 2387.2 <0.00000000000000022 ***
Residuals 78 3.831 0.049
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

4.2.3.5.1.2.2. Test de Independencia Lineal y Correlacin Lineal


En la tabla 12 se muestra el estadstico de correlacin de Pearson que examina las relaciones entre
las variables, obtenindose que el P-value es menor que 0.05, se rechaza la hiptesis nula, por tanto
hay indicios de que la correlacin no es igual a cero con un nivel de confianza del 95.0%.
El coeficiente de correlacin es igual a 0.9840525, indicando una relacin muy fuerte entre las
variables.
Tabla 12. Test de independencia y correlacin lineal
Pearson's product-moment correlation

data: tabla1$X and tabla1$Y.RM.


t = 48.8588, df = 78, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.9751828 0.989769
sample estimates:
cor
0.9840525

4.2.3.5.2. Test de la Bondad Mediante Estadsticos


El test se realizara segn se indic en la parte terica 2.3.4.4. y la realizacin practica mediante la
aplicacin desarrollada en R. (apndice 4, apartado 2.3.5.2), donde se ha usado la funcin gofstat del
paquete fitdistrplus se realiza la estimacin de la bondad de ajuste para distribuciones continuas
mediante los estadsticos de Cramer-von Mises, Kolmogorov-Smirnov y Anderson-Darling.
Para conjunto de observaciones de n > 5 y distribuciones continuas, los test de Cramer-von Mises
y Anderson-Darling se realizan sin conocimiento de los parmetros de la distribucin. El resultado ser
la decisin de rechazar o no la distribucin terica con un nivel de significancia de 0.05. Ambos test se
realizan por mxima verosimilitud.

IV.28
CaptuloIV.ResultadosyAnlisis

Para el ajuste de distribuciones discretas ser utilizado con la misma funcin el estadstico chi-
cuadrado pero con el argumento chisqbreaks o meancount.
Tambin se ha usado la funcin test_ks_dweibull del paquete Sim.DiffProc que realizara el test de
Kolmogorov Smirnov para contrastar la hiptesis si un conjunto de datos sigue o no un modelo de
distribucin Weibull.
Se ha definido en la aplicacin realizada realizar el test de chi-cuadrado para muestras mayores de
30. Pero se ofrecen los estadsticos de Cramer-von Mises, Kolmogorov-Smirnov y Anderson-Darling,
as como la posibilidad de realidad fuera de la aplicacin el test de contraste de Kolmogorov Smirnov.
En la tabla 13 se indican los resultados aportados por la aplicacin desarrollada para los parmetros
obtenidos en el apartado 4.2.3.4. Comparacin de Mtodos de Estimacin de Parmetros, donde
fueron seleccionados los parmetros con menor error cuadrtico medio (MSE) correspondiente a la
estimacin por Mnimos Cuadrados - LSM, siendo para la forma = 0.6299 y para la escala = 39.6759.
Se puede observar como el valor del estadstico obtenido de ks es de 0.0833, comparndolo con el
establecido en la tabla para un nivel de significacin de 5% y una muestra de 80 (tabla K-S) se tendr
un valor de D(0.05,80)=1.36/(raiz2(80))= 0.1521. Dado que el estadstico (0.0833) es menor que el
valor de la tabla (0,1521), no se puede rechazar la hiptesis de que las observaciones no sigan la
distribucin terica. Igualmente, si se analiza el resultado del test de chi-cuadrado, el p-valor es mayor
que el nivel de significancia de 0.05., Por tanto no se puede rechazar la idea de que los datos provienen
de una distribucin Weibull con 95% de confianza.
Tabla 13. Estadsticos de ajuste y test chi-cuadrado
Kolmogorov-Smirnov statistic: 0.08333777
Cramer-von Mises statistic: 0.1082396
Anderson-Darling statistic: 0.6589706
n shape scale chi.chisqpvalue
Resultados 80 0.6299 39.6759 0.3004417

Se ACEPTA la hipotesis nula p-valor > 0.05 (nivel de significancia).


Los datos siguen una distribucin de Weibull segun test Chi-cuadrado.

En la tabla 14 se indican los resultados aportados por el test individual procedentes de la librera,
Sim.DiffProc, donde el estadstico es diferente al presentado para k-s anteriormente, pero en ambos
casos el estadstico obtenido es menor que el valor de la tabla (0,1521), por lo que no se puede
rechazar la hiptesis de que las observaciones no sigan la distribucin terica. As, mismo el resultado
del p-valor es mayor que el nivel de significancia de 0.05., Por tanto no se puede rechazar la idea de
que los datos provienen de una distribucin Weibull con 95% de confianza.
Tabla 14. Test de Ajuste de Kolmogorov-Smirnov
One-sample Kolmogorov-Smirnov test
data: X
D = 0.0793, p-value = 0.6964
alternative hypothesis: two-sided

IV.29
CaptuloIV.ResultadosyAnlisis

4.2.3.6. Propiedades de Fiabilidad


Se han obtenido los parmetros ptimos que representan las observaciones para una distribucin
de Weibull y se ha verificado la bondad del ajuste, quedara la obtencin de las diversas funciones que
representaran adecuadamente a las observaciones. Esto se realizara mediante una aplicacin en R
(Apndice 4, apartado 2.3.6)

4.2.3.6.1. Funcin de Densidad f(t)


La expresin matemtica de la funcin de densidad para la distribucin de Weibull de las
observaciones vendra dada por:
0.6299
1 t 0.62991 t

t
0.6299 t
39.6759
f t e e
39.6759 39.6759

Como se muestra en la figura 70, esta es una funcin creciente y tiende a 0 cuando el tiempo de
fallo tiende a .La probabilidad de fallo vendra indicada por el rea delimitada entre el eje de
abscisas, la lnea curva y el punto de ordenadas o tiempo de fallo. A un mayor tiempo de fallo, se
tendra una mayor probabilidad de fallo. Para tiempos bajos de fallo, se tiene un rea elevada,
indicando una alta probabilidad de fallo debido a una alta mortalidad infantil. El rea total bajo la
curva en un tiempo de fallo infinito sera de 1.

Figura 70. Funcin de Densidad

IV.30
CaptuloIV.ResultadosyAnlisis

4.2.3.6.2. Funcin de Distribucin F(t).


Esta funcin estara matemticamente representada mediante la expresin:
0.6299
t t
t
39.6759
F t f t dt 1 e 1e
0

Como se observa en la figura 71, esta es una funcin es creciente y tiende a 1 cuando el tiempo de
fallo tiende a . Siendo esta una funcin acumulada de probabilidad crece muy rpidamente,
teniendo aproximadamente un 80% de posibilidad de fallo a los 80 das. La probabilidad de ocurrencia
de un fallo en un intervalo de tiempo t1 - t2 pata t2 > t1 seria Ft2 -Ft1.

Figura 71. Funcin de Distribucin.

4.2.3.6.3 .Funcin de Fiabilidad R(t) o Supervivencia S(t).


La expresin matemtica que definira esta funcin seria
0 . 6299
t t

39 .6759
R t 1 F t e e

En la figura 72 se puede observar como esta funcin decreciente y tiende a 0 cuando t . Esta
funcin representa la probabilidad de sobrevivir sin fallos a un tiempo en das. La informacin que
ofrece esta grafica es similar a la funcin de distribucin pero en lugar de tiempos de fallo seria de
tiempos de supervivencia.

IV.31
CaptuloIV.ResultadosyAnlisis

Figura 72. Funciones de Fiabilidad o Supervivencia.

4.2.3.6.4. Funcin de Riesgo o Tasa de Fallo h(t).


Es una funcin est muy afectada por la variacin de la forma , observndose en su expresin
matemtica
1 0.62991
f t t 0.6299 t
h t
R t 39.6759 39.6759

Y en la figura 73 se muestra cmo evoluciona con el tiempo el riesgo de fallo. Como se describi
en el apartado terico al estar comprendido el valor de entre 0 y 1, la funcin de riesgo es
decreciente, disminuyendo la tasa de fallo al aumentar el tiempo. Tambin se observa una zona de al
comienzo del tiempo en la que existe un alto riesgo de fallo debido a la mortalidad infantil, pero con
el paso del tiempo decrece el riesgo de fallo. No se detecta una zona de envejecimiento o desgaste,
en la que un aumento del tiempo llevara un aumento del riesgo o la tasa de fallo.

IV.32
CaptuloIV.ResultadosyAnlisis

Figura 73. Funcin de Riesgo o Tasa de Fallo

4.2.3.6.5. Funcin de Riesgo Acumulado H(t).


La expresin matemtica de la funcin de riesgo acumulado vendra dada por:
0.6299
t t
H t
39.6759

o. tambin podra definirse como H t ln R t .

Esta funcin puede indicar diversos relacionados con la distribucin:

Si H(t) es lineal en t entonces la funcin tasa de fallos o funcin de riesgo h(t), es constante.
Si H(t) es convexa con derivada primera creciente en t entonces la funcin tasa de fallos o
funcin de riesgo h(t), es creciente.
Si H(t) es convexa con derivada primera decreciente en t entonces la funcin tasa de fallos
o funcin de riesgo h(t), es decreciente.
En la figura 74 se muestran cmo aunque parecera seguir una forma lineal, se observa como al
inicio de la grfica cierta curvatura en el sentido de una funcin convexa con derivada decreciente, lo
que explicara la forma decreciente de la funcin tasa de fallos.

IV.33
CaptuloIV.ResultadosyAnlisis

Figura 74. Funcin de Riesgo Acumulado

4.2.3.6.6. Media o Esperanza Matemtica = E[T].


La expresin matemtica y resultado (Apndice 4, apartado 2.3.6.2) para la media del tiempo de
fallo o esperanza matemtica vendra expresada por:

1 1
E T 1 39.6759 1 56.19593
0.6299

1 1
Donde 1 es la funcin Gamma x , para x 1

4.2.3.6.7. Varianza Var[T].


La expresin matemtica y resultado (Apndice 4, apartado 2.3.6.2) para la varianza del tiempo
de fallo vendra expresada por:

2
1 2 2 2
1
2
2
Var T 1 1 39.6759 1 1 6468.7

0.6299 0.6299

4.2.3.6.8. p-cuantil
La expresin matemtica vendra dada por:
1 1
t p log 1 p 39 .6759 log 1 p 0 .6299

IV.34
CaptuloIV.ResultadosyAnlisis

4.2.4. Anlisis Comparativo no Paramtrico y Paramtrico.


La comparacin de los valores de los parmetros fue realizada en el apartado 4.2.3.4. Comparacin
de Mtodos de Estimacin de Parmetros. En las figuras 75-78 se realiza una exposicin resumen de
las grficas ms sobresalientes del anlisis no paramtricos y paramtrico. Se puede observar una
gran similitud entre ellas, aunque se podra indicar las diferencias entre las grficas de la tasa de
reparacin h(t), no tendiendo a cero la no paramtrica con la misma intensidad que lo hace la
paramtrica.

4.2.4.1. Funcin de Distribucin F(t).

Figura 75. Funcin de Distribucin F(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)

4.2.42. Funcin de Fiabilidad R(t) o Supervivencia S(t).

Figura 76. Funcin de Fiabilidad R(t) o Supervivencia S(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)

IV.35
CaptuloIV.ResultadosyAnlisis

4.2.43. Funcin de Riesgo o Tasa de Fallo h(t).

Figura 77. Funcin de Riesgo o Tasa de Fallo h(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)

4.2.4.4. Funcin de Riesgo Acumulado H(t).

Figura 78. Funcin de Riesgo Acumulado H(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)

IV.36
CaptuloIV.ResultadosyAnlisis

4.3. Anlisis de Mantenimiento del Tiempo de Reparacin TTR


4.3.1. Anlisis Descriptivo
EL proceso de anlisis se realizara de forma similar al realizado para fiabilidad, pero en este caso la
variable continua ser el tiempo de reparacin en das TTR.
En el Apndice 4, se puede observar el programa realizado en R para el Anlisis Exploratorio de
datos en el apartado 3.1. En la tabla 15 se muestran los siguientes estadsticos descriptivos obtenidos:
Tabla 15. Estadsticos Descriptivos para el Tiempo De reparacin TTR
> # Medidas de centralizacion
> summary(time)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0104 0.08592 0.1962 0.5716 0.7509 3.861
> mode > range
0.0417 $range
3 [1] 3.8507
> quantile (time)
0% 25% 50% 75% 100%
0.0104 0.085925 0.1962 0.750875 3.8611

> # Medidas de dispersion


> var
[1] 0.6261837
> sd
[1] 0.7913177

> # Medidas de forma (asimetria, curtosis)


> skewness
[1] 2.240114
> kurtosis
[1] 5.136525

De las medidas de centralizacin se puede observar que el tiempo medio fue de 0.5716 das pero
el mximo tiempo de reparacin de un dispositivo fue de 3.861 das y el tiempo mnimo fue de 0.0104
da, siendo de 0.0417 das el tiempo ms frecuente (3 veces) y de 0.1962 el valor mediano. En el 50%
de los casos el tiempo de reparacin oscila entre 0.086 y 0.75 das.
Los tiempos se encuentran en un rango de 3.85 das, presentando una dispersin baja con una
varianza de 0.62618 y con una desviacin tpica de 0.7913, siendo estos valores muy inferiores a los
presentados en el estudio de fiabilidad. Estos datos indican que los datos de esta variable continua
estn menos dispersos respectos a sus valores centrales, lo que supone una representatividad ms
elevada de los valores de la poblacin.
La diferencia entre la media y la mediana, as como de la mediana y la moda x Md Mo , reflejara
un elevado grado de asimetra hacia la derecha, teniendo la distribucin de los datos a la derecha una
cola ms larga que a la izquierda, quedando ratificado por el coeficiente de asimetra 2.240 ( 0.5
aprox. para distribucin Simtrica). El coeficiente curtosis presenta un valor muy elevado (5.136), la
distribucin ser leptocrtica (curtosis muy elevada), presentando una alta concentracin de valores

IV.37
CaptuloIV.ResultadosyAnlisis

en la cola de la distribucin ( 0.5 aprox. cuando la distribucin es Mesocrtica). Esto se pone


claramente de manifiesto en el histograma (Figura 49) con una distribucin normal.
Se obtiene informacin ms clara de las variables de inters mediante los histogramas de la figura
79 y 80, donde se presenta la frecuencia de los tiempos de reparacin. Se puede observar que la
mayora de los dispositivos tienen un tiempo de reparacin menor a 0.75 das (3 cuartil) y en general
se presenta una duracin de la reparacin en 0.2 das (mediana), aunque hay algunas unidades que
tienen un tiempo entre 0.75 y 3.86 das.
La asimetra mencionada anteriormente se debe a las diferencias existentes entre los tiempos de
reparacin de la mayora de los dispositivos y 10 dispositivos que tienen un tiempo de reparacin
extraordinariamente mayor (entre 1.5 y 3.86 das).

Figura 79: Histograma de Tiempo de reparacin de los Dispositivos.

Figura 80. Diagrama de Cajas de Tiempo de Reparacin de los Dispositivos.

IV.38
CaptuloIV.ResultadosyAnlisis

Este ha sido el primer acercamiento a la relacin de los tiempos de reparacin y su distribucin


terica, en la que hay que destacar el alto nivel de dispositivos (40 unidades) con corto tiempo de
reparacin (entre 0 y 0.2 das), pasando a continuacin a una estabilizacin en los tiempos entre 0.20
y 1.2 das (30 unidades) y a partir de los 1.2 das unos tiempos de reparacin muy elevados (10
unidades).
La probabilidad de finalizar una reparacin en un tiempo corto es muy alta. En general, decrece
con el tiempo pero aparecen unos tiempos aleatorios de tiempos de reparacin que no siguen una
tendencia fija.
Por las grficas anteriores no se detectan irregularidades en la continuidad del posible modelo
terico.
Una vez realizado un anlisis exploratorio de los datos de los tiempos de reparacin, se realizara el
anlisis paramtrico, el proceso de anlisis ser modificado con respecto al de fiabilidad, se realizara
partiendo de la asumpcin que las observaciones se pueden comparar de acuerdo a alguna
distribucin terica determinada

4.3.2. Anlisis Paramtrico


4.3.2.1. Estimacin Grafica
Los diagramas de cuantiles (Q-Q plots) comparan en un sistema de coordenadas cartesianas, los
cuantiles de la distribucin terica (eje X) con los cuantiles mustrales (eje Y)
Este tipo de grficos muestran la f.d. linealizada de una distribucin terica junto con una nube de
puntos que representan estimaciones puntuales de la f.d. de T. Evidentemente, cuanto ms se
aproxime la nube de puntos a la recta que aparece en el grfico, tanto mejor ser el ajuste.
Si se lograse aproximar la distribucin de T mediante alguna distribucin terica conocida, sera
posible usar esta ltima para representar grficamente estimaciones de la funcin de distribucin.
En la Figura 81 se muestran diagramas de cuantiles para seis distribuciones tericas (normal,
lognormal, Exponencial, Weibull, Gamma, Poisson) de ajuste a los cuantiles de las observaciones,
estas han sido realizadas mediante la funcin "fitdistr" de R (Apndice 4, apartado 3.2.1. Anlisis
Grafico), los parmetros de la distribucin terica univariante no son fijados y realizndose su
estimacin por mxima verosimilitud.

IV.39
CaptuloIV.ResultadosyAnlisis

Figura 81. Modelacin de las Observaciones con varias Distribuciones Tericas

Se puede observar varias graficas en como los puntos representados en el grfico estn
suficientemente prximos a la recta presentado una distribucin Leptocrtica para las distribuciones
pero no es muy clara cul debera ser la distribucin a elegir.
En teora esta tcnica descriptiva debera de haber sido suficiente para realizar la discriminacin
entre la distribucin de las observaciones y las diferentes distribuciones tericas propuestas, pero a
la vista de los resultados, no es suficiente.
Por lo que se cree conveniente realizar un test analtico que ayude a tomar la decisin de la
distribucin terica ms acertada (aunque conociendo que no formara parte de este apartado de
estimacin grafica).
La idea inicial seria realizar un test de bondad de ajuste y observar el resultado del estadstico. Se
ha optado realizar el test de Kolmogorov-Smirnov mediante la funcin "fitdistr" en R (Apndice 4,
apartado 3.2.1.2. Ajuste Analtico Preliminar), se trata de un test que analiza la diferencia entre las

IV.40
CaptuloIV.ResultadosyAnlisis

frecuencias relativas acumuladas de las distribuciones terica y emprica. En la tabla 16 se indican los
resultados obtenidos:
Tabla 16. Ajuste Analtico ordenado por Ks stat
distribution param1 param2 Log_Likelihood ks stat ks pvalue
[1,] "lognormal" "-1.423" "1.377" "-25.291" "0.093" "0.49896"
[2,] "weibull" "0.77" "0.481" "-29.726" "0.127" "0.15149"
[3,] "gamma" "0.7" "1.225" "-31.378" "0.15" "0.05341"
[4,] "exponential" "1.75" "NA" "-35.252" "0.231" "0.00039"
[5,] "normal" "0.572" "0.786" "-94.287" "0.238" "0.00024"
[6,] "poisson" "0.572" "NA" "-Inf" "0.565" "0"

Si son observados los valores del estadstico de K-S, los cuales habra que comparar con el
establecido en la tabla K-S D0.05, 80 =1.36/80 = 0.1521 para un nivel de signicacin de 5% y una
muestra de 80 observaciones, se tendra que dado que el estadstico de las distribuciones Lognormal,
Weibull y Gamma son menores que el valor de la tabla (0.1521) no se puede rechazar la hiptesis de
que las observaciones sigan la distribucin terica. Por tanto, el uso del estadstico K-S o el K-S p-value
no es suficiente ((P-value mayores de 0.05 indicaran que las observaciones proviene de la distribucin
seleccionada con 95% de confianza), ya que es un test muy conservador y no indica claramente la
distribucin ptima.
Pero si analizamos los resultados ordenados en la tabla 17 para el estadstico de log verosimilitud
(no es ms que el logaritmo de la verosimilitud para la estimacin de los parmetros de una
distribucin de probabilidad mediante el "mtodo de mxima verosimilitud" (en ingls "method of
maximum likelihood" o MLE), se observa como la distribucin que tiene un ajuste ms ptimo sera la
distribucin Lognormal.
Tabla 17. Ajuste Analtico ordenado por Log_Likelihood
distribution param1 param2 Log_Likelihood ks stat ks pvalue
[1,] "lognormal" "-1.423" "1.377" "-25.291" "0.093" "0.49896"
[2,] "weibull" "0.77" "0.481" "-29.726" "0.127" "0.15149"
[3,] "gamma" "0.7" "1.225" "-31.378" "0.15" "0.05341"
[4,] "exponential" "1.75" "NA" "-35.252" "0.231" "0.00039"
[5,] "normal" "0.572" "0.786" "-94.287" "0.238" "0.00024"
[6,] "poisson" "0.572" "NA" "-Inf" "0.565" "0"

4.3.2.2. Estimacin Grafica Paramtrica


Una que se ha realizado el estudio comparativo de las observaciones con distintas distribuciones y
encontrarse la distribucin lognormal como la ptima en el ajuste a las observaciones.
Se ha de indicar que una variable aleatoria tk de una muestra aleatoria t1, t2,..., tk se distribuye
como una lognormal de parmetros a y b, cuando los logaritmos naturales de dichas variables ln(t1),
ln(t2),.., ln(tk) se describen mediante una distribucin normal con media y desviacin estndar
finita. La transformacin Y= ln(t) producira una variable aleatoria normal con una media de ln(a) =

IV.41
CaptuloIV.ResultadosyAnlisis

y una desviacin estndar de b = . El anlisis de los medibles de fiabilidad se realiza con la estimacin
de los parmetros y de la distribucin log-normal bajo el ln(t).
Cuando un ajuste sea vlido (mayor de 0.95 para el coeficiente de correlacin en la regresin
lineal), la funcin de densidad de la distribucin que representara los datos, tendra la forma:
1 ln t 2

1 2
f t e
t0
t 2
Donde y se corresponden con la media y la desviacin tpica del logaritmo de los tiempos de
reparacin.
La funcin de no reparabilidad para una variable aleatoria con distribucin lognormal, se puede
escribir como:
ln t
R t

donde es la funcin de distribucin estndar.
La linealizacin de la funcin de no reparabilidad (supervivencia) de la distribucin log-normal
vendra dada por:
ln t
1 R t 1 1 F t 1 1 F pi

donde -1 se corresponde con los cuantiles de la distribucin normal estndar.
Por tanto, los datos observacionales siguen una distribucin lognormal, si los puntos:

1 i 0.3
1 n 0.4 , ln t

Para i = 1, 2, , 80 estn en secuencia.
Podemos estimar, adems, los parmetros y a travs de la pendiente de la recta, 1/ y la
ordenada en el origen, /.

Debido a la relacin R t ln t es posible hallar las distintas medidas de fiabilidad a



travs de la estimacin de los parmetros y .
Se llevara a cabo la estimacin grfica de los parmetros del modelo propuesto. La base de estos
mtodos grficos es estimar la funcin de distribucin emprica de los datos y representarla en unas
escalas tales que si el modelo elegido es el correcto, los datos presenten un aspecto lineal.
En la actualizar los programas informticos permiten realizar este proceso de forma rpida y
sencilla. En el Apndice 4, apartado 3.2.1.3., se muestra la programacin realizada en R, obtenindose
los resultados de la regresin lineal y el grafico de probabilidad para distribucin lognormal con
respecto a las observaciones.

IV.42
CaptuloIV.ResultadosyAnlisis

En la figura 82 se muestra como las la nube de puntos de las observaciones con respecto a su recta
de regresin asociada sigue un patrn bastante lineal, por lo cual es coherente pensar que las
observaciones puedan seguir una distribucin lognormal, pero hay que indicar como a la izquierda de
la recta existe una cola de datos hacia abajo lo que es indicativo de la existencia de un valor en el
parmetro de localizacin y para que los clculos estuvieran ajustados habra que realizar este estudio
de forma triparamtrica. Se obviara la consideracin anterior y se seguir analizando los datos para
una distribucin Lognormal biparamtrica.

Figura 82. Grfico de Linealizacin de la Funcin de no Reparabilidad

Observando la figura anterior, se pueden realizar los clculos de los parmetros de la


distribucin, el valor de vendra dado a travs del clculo de la inversa de la pendiente de la recta,
siendo est pendiente formada por la lnea horizontal del eje y con valor 0 y la proyeccin del valor
ms elevado sobre la recta (color verde) y la proyeccin en el eje x del punto de la lnea con y=0.
Matemticamente seria a = 1/ = y/x= 2.4/(4.8-1.5)= 0.72727, por lo que = 1.375
La media se obtendra a travs de la ordenada en el origen y considerando que = b*, b seria
el valor en el eje y para x=0, en la figura muestra un valor aproximado de -1, se tendr que = b* =
-1*1.375 = -1.375. Por tanto, los valores de los parmetros de la distribucin de Lognormal que se
ajustan a las observaciones serian
Des. Estand. = 1.375 Media = -1.375.
y la recta de regresin para esta estimacin vendra dada por y= --1 + 1.375 x.

IV.43
CaptuloIV.ResultadosyAnlisis

En la figura 83 se muestra un resumen de ajuste con cuatro grficas, la primera un histograma


con la curva de la funcin de densidad, una grfica con la funcin acumula de probabilidad o funcin
de distribucin de las distribuciones empicas y tericas, el Grafico Q-Q (grafico de cuantiles) y el
grafico P-P de probabilidad. En el grafico Q-Q se observa la falta de ajuste en la cola superior de la
distribucin y en el grafico P-P no se observa falta de ajuste en su parte central.

Figura 83. Grfico de ajuste a una distribucin Lognormal

4.3.2.3. Estimacin Puntual


La estimacin puntual consiste en obtener, a partir de las observaciones, un valor que se
aproxime al verdadero valor (desconocido) del parmetro de inters.

4.3.2.3.1. Estimacin por Mnimos Cuadrados


Las estimaciones mnimo cuadrticas se calculan ajustando una recta de regresin a los puntos
de un conjunto de observaciones que tiene la suma mnima de las desviaciones al cuadrado (error
de mnimos cuadrados). La estimacin de los parmetros de Lognormal por este mtodo se realizara
segn se indic en el apartado 4.3.2.2. y la realizacin practica de estimacin de parmetros
mediante funciones en R, (Apndice 4, apartado 3.2.2.1). Los parmetros de la ecuacin de la recta

IV.44
CaptuloIV.ResultadosyAnlisis

de mnimos cuadrados que relaciona la variable independiente con la variable dependiente vienen
dados como resultado de la regresin lineal por:
Coefficients:
(Intercept) X
-0.9977 0.7013
Por lo tanto, la ecuacin de la recta de mnimos cuadrados seria y= -0.9977 + 0.7013 x.
Obtenindose los siguientes valores para los parmetros despus del clculo realizado
Des. Estand. = 1.4258 Media = -1.4225

4.3.2.3.2. Estimacin por Mxima Verosimilitud


La maximizacin de la funcin de probabilidad determina los parmetros que son ms propensos
a producir los datos observados. La estimacin por este mtodo se realizara segn se indic en la
parte terica 2.3.3.2.2. y la realizacin practica de estimacin de parmetros mediante funciones en
R, (Apndice 4, apartado 3.2.2.2).

4.3.2.3.2.1. Estimaciones para Observaciones Completas


La funcin fitdist de la librera fitdistrplus ser la que permitir el clculo de los parmetros a
una distribucin de Lognormal por mxima verosimilitud. Obteniendo la siguiente informacin
sobre los valores de los parmetros
Des. Estand. = 1.37678 Media = -1.42255

4.3.2.3.2.2. Estimaciones para Observaciones con Censura


Mediante la funcin lnormMLE de la librera START, es posible calcular las estimaciones por el
mtodo de mxima verosimilitud de los parmetros de la distribucin Lognormal y realizar las
estimaciones tanto para muestras completas como para muestras con censura tipo II.
En el caso de muestras completas el argumento si se definir como numeric(length(yi))+1, que
es el valor por defecto, pero en el caso de muestras censuradas (censura tipo II), se reordenara la
muestra con el comando sort y se definir si como c(rep(1,r),rep(0,n-r)), por lo que tendremos una
muestras ordenada con r datos no censurados y n - r datos censurados. Los valores que devuelve esta
funcin son los siguientes:
Des. Estand. = 1.37678 Media = -1.42255

IV.45
CaptuloIV.ResultadosyAnlisis

4.3.2.3.2. Estimacin por Momentos


Este mtodo obtiene los para metros de la distribucin mediante la obtencin de un cierto nmero
de momentos tericos de la distribucin de la poblacin e igualarlos con los momentos de las
observaciones.
La estimacin por este mtodo se realizara segn se indic en la parte terica 2.3.3.2. y la
realizacin practica de estimacin de parmetros mediante funciones en R, (Apndice 4, apartado
3.2.2.3). Mediante la funcin pelwei del paquete lmon es posible realizar el clculo de los parmetros
de la distribucin mediante el mtodo de momentos, se ha seleccionado para el primero y segundo.
Con la indicacin de bound=000, el clculo se realiza forzando el parmetro de localizacin a 0. Los
parmetros obtenidos seran los siguientes:
Des. Estand. = 1.28233 Media =-1.38153

4.3.2.4. Estimacin de Parmetros por Intervalos.


A diferencia de lo que ocurre con la estimacin puntual, la estimacin por intervalos ofrece
informacin sobre la exactitud de la estimacin. Ello es debido a que este tipo de estimacin
proporciona un intervalo dentro del cual hay una alta probabilidad (nivel de confianza) de que est
contenido el verdadero valor del parmetro.

4.3.2.4.1. Estimacin por Mnimos Cuadrados


La estimacin de parmetros por intervalos se realizara segn se indic en la parte terica
(2.3.3.2.3.) y la realizacin practica mediante R, (Apndice 4, apartado 3.2.3.1).
Para un valor de Des. Estand. = 1.4258 y de Media = -1.4225, se obtienen los siguientes
lmites con un intervalo de confianza del 95%:
2.5% 97.5% 2.5% 97.5%
1.3826 1.4718 -1.4844 -1.3607

En la figura 84 se muestra la grfica de regresin lineal mnimo cuadrtica con los intervalos de
confianza y prediccin al 95% para valores originales de tiempo (rojo). Tambin estn representados
los intervalos de confianza y prediccin al 95% para nuevos valores de tiempo (extrapolados y ms
finamente/uniformemente espaciados que los datos originales) (azul). Los intervalos ms estrechos
corresponderan a los intervalos de confianza al 95% para los valores esperado de los tiempos de
reparacin, mientras que los intervalos ms amplios corresponderan a los valores de las
observaciones de los tiempos de reparacin. Estas diferencias son debidas a la varianza del error
producida por las perturbaciones.

IV.46
CaptuloIV.ResultadosyAnlisis

Figura 84. Intervalos de Confianza y Prediccin al 95%

4.3.2.4.2. Estimacin por Mxima Verosimilitud


El clculo de las varianzas de y es complejo, ya que involucra el clculo de la inversa de la

matriz de derivadas segundas del logaritmo de la funcin de verosimilitud. La mayora de programas


estadsticos sobre fiabilidad disponen de rutinas que calculan estas varianzas.
La estimacin por este mtodo se realizara segn se indic en la parte terica 2.3.3.3.2. y la
realizacin practica mediante R, (Apndice 4, apartado 3.2.3.2).
Dentro de la librera Sim.DiffProc se encuentra la funcin Ajdlognorm, que proporcionar
intervalos de confianza para el modelo Lognormal, cuando se trabaje con muestras de datos no
censuradas
Para unos valores de los parmetros de Des. Estand. = 1.3819 y de Media =-1.4115, teniendo
los siguientes lmites con un intervalo de confianza del 95%:
2.5% 97.5% 2.5% 97.5%
1.19159 1.62901 -1.71999 -1.1030

IV.47
CaptuloIV.ResultadosyAnlisis

4.3.2.5. Comparacin de Mtodos de Estimacin de Parmetros.


Despus de haber realizado la estimacin de parmetros de Lognormal mediante diversos
mtodos (mtodos grficos y analticos), sera necesario evaluar a raz de los resultados cual sera el
mtodo ms apropiado. Para comparar los tres mtodos, se utiliz la prueba MSE (Mean Squared
Error) mediante una funcin en R. (Apndice 4, apartado 3.2.4). MSE se ha calculado de la siguiente
forma
n
2
MSE F x F x
i 1
i i

donde:

lnt i 0.3
F t y F xi
n 0.4
La Tabla 18 muestra los resultados de las estimaciones para los parmetros de forma y escala y el
error cuadrtico medio (MSE) para cada mtodo.
Des. Estand. = 1.3819 y de Media =-1.4115, t
Tabla 18.Resultados del Estudio Comparativo de Parmetros

Mtodo MSE
EstimacinNoParamtrica-(Lib.Survival-MLE)
= 1.37678 = -1.42255 18.51123
AnlisisParamtrico
-EstimacinGraficaParamtrica
= 1.375 = -1.375 16.06686
-EstimacinPuntual
1.EstimacinporMnimosCuadrados-LSM
= 1.4258 = -1.4225 20.20958
2.EstimacinporMximaVerosimilitud-MLE
2.1.ObservacionesCompletas
2.1.1.Librerafitdistrplus
= 1.37678 = -1.42255 18.51123
2.2.ObservacionesconCensura-Lib.START
= 1.37678 = -1.42255 18.51123
3.EstimacinporMomentos-MOM
= 1.28233 = -1.38153 14.97755

En la tabla 19, se presentan los resultados ordenados por MSE de menor a mayor. La estimacin
por Momentos MOM es la que presenta un menor MSE, para unos valores de = 1.28233 y = -

IV.48
CaptuloIV.ResultadosyAnlisis

1.38153. Los valores de MSE son elevados debido los errores producidos en la aplicacin de la
distribucin normal estndar a valores negativos o mayores de 1.
Tabla 19.Resultados Ordenados del Estudio Comparativo de Parmetros

Mtodo MSE
MOM - Est. por Momentos 14.97755
Estimacin Grafica 16.06686
MLE - Est. No Paramtrica - Lib. Survival 18.51123
MLE - Obs. Completas - lib. fitdistrplus 18.51123
MLE - Obs. con Censura - Lib. START 18.51123
LSM - Est. por Mnimos Cuadrados 20.20958

Inicialmente podra pensarse que la estimacin grafica seria la que tuviera un error ms elevado,
pero no ha sido as. De todas formas, debido a su variabilidad, las estimaciones de los parmetros por
este mtodo podran dar cualquier resultado, siendo su MSE poco predecible. Por tanto, para los
valores y la cantidad de observaciones (80) se ha propuesto como los parmetros que provienen del
estudio de estimacin por momentos MOM como los ms acertados para la distribucin de
Lognormal.
En resumen el orden de los mtodos basados en su exactitud para esta aplicacin y con las
funciones y aplicaciones realizadas en R, seria:
Mtodo de los Momentos - MOM
Mtodo de Mxima Verosimilitud MLE.
Mtodo de Mnimos Cuadrados LSM.
Mtodo grfico.

4.3.2.6. Bondad de Ajuste


4.3.2.6.1. Test de Bondad de ajuste para Mnimos Cuadrados
4.3.2.6.1.1. Interpretacin de los resultados
En la tabla 20 se indican los resultados aportados mediante diversos comandos en R. (Apndice 4,
apartado 3.2.5.1). Los parmetros de la ecuacin de la recta de mnimos cuadrados que relaciona la
variable independiente con la variable dependiente vienen dados por la columna Estimate de la
tabla Coefficients. Por lo tanto, la ecuacin de la recta de mnimos cuadrados seria
y = -0.99771 + 0.70135 x
El coeficiente de determinacin (es decir, el coeficiente de correlacin al cuadrado) mide la
bondad del ajuste de la recta a los datos. A partir de los datos de la tabla, se muestra que su valor en

IV.49
CaptuloIV.ResultadosyAnlisis

este caso es Multiple R-squared = 0.9812, por tanto el estadstico R2 indica que el modelo ajustado
explica 98.12% de la variabilidad en Y.
Si suponemos que los datos proceden de un modelo de regresin simple de la forma yi= 0 + 1 xi
+ i, i=1,,n, donde los errores aleatorios i son independientes con distribucin normal de media 0
y varianza 2.
Bajo este modelo,
Loserrorestpicos de los estimadores de los parmetros 0 y 1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores son 0.02178 y 0.011
respectivamente.
La columna t value contiene el estadsticot, es decir, el cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes H0: 0 = 0 y Ha: 1
0. Los correspondientes p-valores aparecen en la columna Pr(>|t|).Puesto que el P-value es
menor que 0.05, existe una relacin estadsticamente significativa entre yy x con un nivel de
confianza del 95.0% para :
i 0 .3
y 1 1 y x ln t
n 0 .4

El estimador de ladesviacintpicadeloserrores aparece como Residual standard error y


su valor es de 0.1355.
Tabla 20. Resultados de la Regresin Lineal

Call:
lm(formula = Y(RM) ~ X, data = tabla1)
Residuals:
Min 1Q Median 3Q Max
-0.43267 -0.12785 0.02604 0.09813 0.31219

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.99771 0.02178 -45.8 <2e-16 ***
X 0.70135 0.011 63.74 <2e-16 ***
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 0.1355 on 78 degrees of freedom


Multiple R-squared: 0.9812, Adjusted R-squared: 0.9809
F-statistic: 4063 on 1 and 78 DF, p-value: < 2.2e-16

4.3.2.6.1.2. ANOVA y Test de independencia lineal


4.3.2.6.1.2.1. Anlisis de varianza del modelo de regresin lineal
En la tabla 21 se muestra que el P-value es menor que 0.05, existe una relacin estadsticamente
significativa entre Y y X con un nivel de confianza del 95.0%.

IV.50
CaptuloIV.ResultadosyAnlisis

Tabla 21. Anlisis de la Varianza de la Regresin Lineal


Analysis of Variance Table
Response:Y(RM)
Df Sum Sq Mean Sq F value Pr(>F)
X 1 74.591 74.591 4062.6 < 2.2e-16 ***
Residuals 78 1.432 0.018
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

4.3.2.6.1.2.2. Test de independencia lineal y correlacin lineal


El estadstico de correlacin de Pearson (tabla 22) examina las relaciones entre las variables,
obtenindose que el P-value es menor que 0.05, se rechaza la hiptesis nula, por tanto hay indicios
de que la correlacin no es igual a cero con un nivel de confianza del 95.0%.
El coeficiente de correlacin es igual a 0.9905363, indicando una relacin muy fuerte entre las
variables.
Tabla 22. Test de independencia y correlacin lineal

Pearson'sproduct-momentcorrelation
data: tabla1$X and tabla1$Y.RM.
t = 63.7386, df = 78, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.9852459 0.9939355
sample estimates:
cor
0.990536

4.3.2.6.2. Test de la Bondad Mediante Estadsticos


El test se realizara segn se indic en la parte terica 2.3.4.4. y la realizacin practica mediante la
aplicacin desarrollada en R. (Apndice 4, apartado 3.2.5.2), donde se ha usado la funcin gofstat del
paquete fitdistrplus se realiza la estimacin de la bondad de ajuste para distribuciones continuas
mediante los estadsticos de Cramer-von Mises, Kolmogorov-Smirnov y Anderson-Darling.
Para conjunto de observaciones de n > 5 y distribuciones continuas, los test de Cramer-von Mises
y Anderson-Darling se realizan sin conocimiento de los parmetros de la distribucin. El resultado ser
la decisin de rechazar o no la distribucin terica con un nivel de significancia de 0.05. Ambos test se
realizan por mxima verosimilitud.
Para el ajuste de distribuciones discretas ser utilizado con la misma funcin el estadstico chi-
cuadrado pero con el argumento chisqbreaks o meancount.
Tambin se ha usado la funcin test_ks_dlognorm del paquete Sim.DiffProc que realizara el test
de Kolmogorov Smirnov para contrastar la hiptesis si un conjunto de datos sigue o no un modelo de
distribucin Lognormal.

IV.51
CaptuloIV.ResultadosyAnlisis

Se ha definido en la aplicacin realizada realizar el test de chi-cuadrado para muestras mayores de


30. Pero se ofrecen los estadsticos de Cramer-von Mises, Kolmogorov-Smirnov y Anderson-Darling,
as como la posibilidad de realidad fuera de la aplicacin el test de contraste de Kolmogorov Smirnov.
En la tabla 23 se indican los resultados aportados por la aplicacin desarrollada para los parmetros
obtenidos en el apartado 4.3.2.4. Comparacin de Mtodos de Estimacin de Parmetros, donde
fueron seleccionados los parmetros con menor error cuadrtico medio (MSE) correspondiente a la
estimacin por Momentos MOM, siendo para la desviacin estndar de = 1.28233 y para la media
= -1.38153.
Se puede observar como el valor del estadstico obtenido de ks es de 0.09259976, comparndolo
con el establecido en la tabla para un nivel de significacin de 5% y una muestra de 80 (tabla K-S) se
tendr un valor de D(0.05,80)=1.36/(raiz2(80))= 0.1521. Dado que el estadstico (0.09259976) es
menor que el valor de la tabla (0,1521), no se puede rechazar la hiptesis de que las observaciones no
sigan la distribucin lognormal. Igualmente, si se analiza el resultado del test de chi-cuadrado, el p-
valor es mayor que el nivel de significancia de 0.05., Por tanto no se puede rechazar la idea de que los
datos provienen de una distribucin Lognormal con 95% de confianza.
Tabla 23. Estadsticos de ajuste y test chi-cuadrado
Kolmogorov-Smirnov statistic: 0.09259976
Cramer-von Mises statistic: 0.1430181
Anderson-Darling statistic: 0.745981
n meanlog sdlog chi.chisqpvalue
Resultados 80 -1.38153 1.28233 0.1470593

Se ACEPTA la hipotesis nula p-valor > 0.05 (nivel de significancia).


Los datos siguen una distribucin de Lognormal segun test Chi-cuadrado.

En la tabla 24 se indican los resultados aportados por el test individual procedentes de la librera,
Sim.DiffProc (0.1130335), donde el estadstico es diferente al presentado para ks anteriormente, pero
en ambos casos el estadstico obtenido es menor que el valor de la tabla (0,1521), por lo que no se
puede rechazar la hiptesis de que las observaciones no sigan la distribucin terica. As, mismo el
resultado del p-valor es mayor que el nivel de significancia de 0.05., Por tanto no se puede rechazar
la idea de que los datos provienen de una distribucin Lognormal con 95% de confianza.
Tabla 24. Test de Ajuste de Kolmogorov-Smirnov

One-sample Kolmogorov-Smirnov test


data: X
D = 0.113, p-value = 0.2584
alternative hypothesis: two-sided

IV.52
CaptuloIV.ResultadosyAnlisis

4.3.2.7. Propiedades del Mantenimiento


Se han obtenido los parmetros ptimos que representan las observaciones para una distribucin
de Lognormal y se ha verificado la bondad del ajuste, quedara la obtencin de las diversas funciones
que representaran adecuadamente a las observaciones. Esto se realizara mediante una aplicacin en
R (Apndice 4, apartado 3.2.6)

4.3.2.6.1. Funcin de Densidad de Probabilidad de Reparacin f(t)


La expresin matemtica de la funcin de densidad para la distribucin de Lognormal de las
observaciones vendra dada por:
1 ln t 2 1 ln t 1.38153 2

1 2 1 2 1.28233
f t e
e
t 2 t 1.28233 2
Como se muestra en la figura 85, esta es una funcin decreciente y tiende a 0 cuando el tiempo de
reparacin tiende a .La probabilidad de reparacin vendra indicada por el rea delimitada entre el
eje de abscisas, la lnea curva y el punto de ordenadas o tiempo de reparacin. A un mayor tiempo de
reparacin, se tendra una mayor probabilidad de reparacin. Para tiempos bajos de reparacin, se
tiene un rea elevada, indicando una alta probabilidad de reparacin debido a una alta mortalidad
infantil. El rea total bajo la curva en un tiempo de reparacin infinito sera de 1.

Figura 85. Funcin de Densidad de Probabilidad de Reparacin

4.3.2.7.2. Funcin de Mantenibilidad M(t).


Esta funcin estara matemticamente representada mediante la expresin:

lnt lnt 1.38153


M t
1.28233
donde sera la distribucin normal estndar.

IV.53
CaptuloIV.ResultadosyAnlisis

Como se observa en la figura 86, esta es una funcin es creciente y tiende a 1 cuando el tiempo de
reparacin tiende a . Siendo esta una funcin acumulada de probabilidad crece muy rpidamente,
teniendo aproximadamente un 90% de posibilidad de reparacin en el 1 da. La probabilidad de
ocurrencia de reparacin en un intervalo de tiempo t1 - t2 pata t2 > t1 seria Mt2 -Mt1.

Figura 86. Funcin de Mantenibilidad.

4.3.2.7.3 .Funcin de no Reparabilidad Rr(t).


La expresin matemtica que definira esta funcin seria

lnt 1.38153
Rr t 1 F t 1
1.28233
En la figura 87 se puede observar como esta funcin decreciente y tiende a 0 cuando t . Esta
funcin representa la probabilidad de que no se haya completado la reparacin de los dispositivos
para un tiempo determinado t en das. La informacin que ofrece esta grafica es similar a la funcin
de mantenibilidad pero en trminos inversos.

Figura 87. Funciones de no Reparabilidad.

IV.54
CaptuloIV.ResultadosyAnlisis

4.3.2.7.4. Funcin de Tasa de Reparacin h(t).


La expresin matemtica viene dada por:
1 1.38153 lnt 2

2

1.28233 2
e
h t
1.38153 lnt
t 1.28233 Erfc
1.28233 2
En la figura 88 se muestra cmo evoluciona con el tiempo la tasa de reparacin. Como se describi
en el apartado terico, la funcin de tasa de reparacin o tendencia de reparabilidad es decreciente,
disminuyendo la tasa de reparacin al aumentar el tiempo. Tambin se observa una zona de al
comienzo del tiempo en la que existe un alto riesgo de reparacin debido a la mortalidad infantil, pero
con el paso del tiempo decrece la tasa de reparacin. La probabilidad de que una avera sea reparada
a partir de los 6 das es muy pequea (5%), resultando una tasa de reparacin de 2.5% de que una
avera no se haya reparado para el tiempo de 10 das.

Figura 88. Funcin de Tasa de reparacin

4.3.2.7.5. Funcin de Tasa de Reparacin Acumulada H(t).


La expresin matemtica de la funcin de riesgo acumulado vendra dada por:
t
Ht h t dt o H t lnR t
0

En la figura 89 se muestran cmo aunque parecera seguir una forma lineal, se observa como al
inicio de la grfica cierta curvatura en el sentido de una funcin convexa con derivada decreciente, lo
que explicara la forma decreciente de la funcin tasa de reparacin.

IV.55
CaptuloIV.ResultadosyAnlisis

Figura 89. Funcin de Riesgo Acumulado

4.3.2.7.6. Media o Esperanza Matemtica = E[T].


La expresin matemtica y resultado (Apndice 4, apartado 3.2.6.2) para la media del tiempo de
reparacin (das) o esperanza matemtica vendra expresada por:
2
1.38153
1.282332
2 2
E T e
e
0.5715834

4.3.2.7.7. Varianza Var[T].


La expresin matemtica y resultado (Apndice 4, apartado 3.2.6.2) para la varianza del tiempo
de reparacin (das) vendra expresada por:

Var T e 2
2

1 e 1.364902
2

4.3.2.7.8. p-cuantil
La expresin matemtica vendra dada por:

tp e
1.38153 1.28233 2InverseErfc 2 p

4.3.3. Anlisis No Paramtrico


Una vez realizado el anlisis paramtrico de los datos de los tiempos de reparacin, se pasara a
realizar un estudio mediante mtodos no paramtricos.

IV.56
CaptuloIV.ResultadosyAnlisis

4.3.3.1. Funcin de no Reparabilidad.


El aspecto analtico fue indicado en el apartado terico 2.3.2.2. (Estimador de Kaplan-Meier
(KM)).La funcin de supervivencia indica en esta situacin la probabilidad en cada tiempo t de que el
dispositivo no est an reparado. Como se indic que la estimacin del producto-lmite de S(t) para la
duracin t, es una funcin escalonada, que se calcula como el producto de uno menos el riesgo
existente hasta el perodo t:
nj d j
R t
j:t j t nj

Utilizando la normalidad asinttica de R t , se puede construir el intervalo de confianza

aproximado para R t , a un nivel del 100(1-)%:

R t Z ee R t

1
2

donde Z
es el cuantil correspondiente a la distribucin normal estndar y
1
2


ee R t Var R t es el error estndar de estimacin del estimador KM de R(t), que se calcula
con la frmula de Greewood de la varianza del estimador KM, el cual viene dado por la expresin
2 dt
Var R t R t j:t j t
nj nj dt

En el apartado 3.3. del Apndice 4, se puede observar el programa realizado en R para el anlisis
no paramtrico con comentarios adicionales.
El estimador de Kaplan-Maier para la funcin de supervivencia es obtenido mediante la librera
Survival de R con la funcin survfit. Esta funcin en su forma ms sencilla, solo requiere un objeto de
supervivencia creado por la funcin Surv, en el cual se captura el tiempo observado de la variable y su
estado (censurado o no).
Presenta los argumentos time y event. El argumento time corresponde al tiempo desde que el
dispositivo entra al estudio, hasta que este presenta la reparacin o censura. El argumento event es
una variable binaria que indica el estatus del tiempo registrado, donde, de forma predeterminada
corresponde a
0 <- si el dato es censurado
1 <- si la reparacin es observado
Debido que no se tiene informacin de datos censurados, se asumir un estudio con datos
completos. Los dispositivos han fallado en el tiempo de control y, por tanto, su estado se representara
por 1 en todos ellos.

IV.57
CaptuloIV.ResultadosyAnlisis

La funcin survfit de R indicara la informacin del estimador de Kaplan-Meier para la funcin de


supervivencia(tabla 25), donde se tienen 80 dispositivos de estudio, los 80 presentan reparacin y 0
presentan censura, el tiempo mediano de que no est an reparado es de 0.196 y un intervalo con un
95 % de confianza est dado en su lmite inferior por 0.132 y en su lmite superior por 0.403 (en los
intervalos de confianza obtenidos por la funcin survfit, para Inf toma el valor de 1 y -inf toma el valor
de 0) (esta banda es estimada por el mtodo ordinario ).
Tabla 25. Estimador de Kaplan-Meier para el Tiempo de no Reparacin
records n.max n.start events median 0.95LCL 0.95UCL
80 80 80 80 0.196 0.132 0.403

Informacin adicional se puede obtener mediante la funcin summary como se indica en la tabla
26 (en el apartado 2.2. del Apndice 4 se puede observar la tabla completa)
Tabla 26. Informacin del Estimador de Kaplan-Meier
time n.risk n.event survival std.err lower95%CI upper95%CI
0.0104 80 1 0.9875 0.0124 0.96315 1
0.0208 79 2 0.9625 0.0212 0.92087 1
0.0243 77 2 0.9375 0.0271 0.88446 0.9905
0.0417 75 3 0.9 0.0335 0.83426 0.9657
0.0431 72 1 0.8875 0.0353 0.81826 0.9567
0.0486 71 1 0.875 0.037 0.80253 0.9475
0.059 70 2 0.85 0.0399 0.77175 0.9282
0.0625 68 1 0.8375 0.0412 0.75666 0.9183
0.0694 67 3 0.8 0.0447 0.71235 0.8877
0.0764 64 1 0.7875 0.0457 0.69786 0.8771
0.0799 63 1 0.775 0.0467 0.68349 0.8665
0.0833 62 2 0.75 0.0484 0.65511 0.8449
0.0868 60 2 0.725 0.0499 0.62716 0.8228
0.0938 58 2 0.7 0.0512 0.59958 0.8004
0.0972 56 1 0.6875 0.0518 0.58593 0.7891
0.1007 55 1 0.675 0.0524 0.57236 0.7776

donde time representa el tiempo para el que se presenta la informacin (anteriormente, la


informacin se presentaba para el tiempo dado por median ), n.risk indica la cardinalidad del conjunto
en riesgo o el nmero de individuos que continua en estudio al tiempo correspondiente, n.event
corresponde al nmero de no reparaciones que se presentan entre cada tiempo, survival indica el
valor que toma la funcin de no reparacin estimada por el mtodo Kaplan-Meier en el tiempo
correspondiente, std.err corresponde al error estndar estimado para la funcin de supervivencia en
el tiempo respectivo (expresin de Greewood) y finalmente lower95%CI y upper95 %CI denotan el
intervalo de confianza para la funcin de supervivencia en cada tiempo como se mencion
anteriormente. El tipo de intervalo utilizado es el estndar (argumento conf.type= plain en la
funcin survfit), en el caso de observar valores fuera de lmites del intervalo, se podra ir a estimar un
intervalo de confianza para la funcin de supervivencia mediante la transformacin del valor de R t

(i.e. log o log-log), expresado en los apartados de teora 2.3.2.2.1. y 2.3.2.2.2.

IV.58
CaptuloIV.ResultadosyAnlisis

En la figura 90 se muestra el estimador de Kaplan-Meier de la funcin de no reparabilidad con el


intervalo de confianza para los 80 dispositivos, podra ser de inters analizar los tiempos de censura,
pero este no es el caso, ya que toda la muestra fue observada.

Figura 90. Funcin de no Reparabilidad - Estimada con Intervalo de Confianza.

Se puede analizar la evolucin de la probabilidad de no reparabilidad en el modelo con su


respectivo intervalo de confianza y considerar la proporcin de dispositivos que no estn reparados
entre cada periodo de tiempo. Se muestran 4 zonas diferencias con pendientes diferentes, siendo la
ms aguda de 0 a 0.25 das, una zona fuerte entre 0.25 y 1 das, una zona media entre 1 y 2.6 das una
zona de estabilizacin entre 2.6 y 4 das.
En la figura 91 se muestra un grfico con la comparativa de resultados de la Estimacin de la
Funcin de no reparabilidad mediante los mtodos de Kaplan-Meier y Nelson-Aalen.

Figura 91. Comparativa de Mtodos de Estimacin de la Funcin de no reparabilidad

IV.59
CaptuloIV.ResultadosyAnlisis

4.3.3.2. .Funcin de Mantenibilidad M(t)


Cuando se analizan tiempos de reparacin, es ms sencillo realizarlo con la funcin de
mantenibilidad M(t), que indica de la probabilidad de que el sistema est disponible y por tanto
reparado, para un tiempo t.
La funcin de Mantenibilidad vendra representada por M(t)=1-R(t), en la figura 92.

Figura 92. Funcin de Mantenibilidad

Se puede analizar la evolucin de la Mantenibilidad en el modelo con su respectivo intervalo de


confianza y considerar la proporcin de dispositivos que estn reparados para un periodo de tiempo
de determinado.

4.3.3.3. Funcin Tasa de Reparacin Acumulada


En la figura 93 se presenta la funcin tasa de reparacin acumulada H(t) = - ln R(t), donde se puede
apreciar los valores que va tomando y a partir de ellos, se demuestra el carcter de funcin cercana a
la linealidad, con una pequea convexidad.

IV.60
CaptuloIV.ResultadosyAnlisis

Figura 93. Funciones de Tasa de Reparacin Acumulada.

La funcin de tasa de reparacin acumulada y la funcin de no reparabilidad estn relacionadas


para datos continuos de la siguiente forma R(t) = exp {-H(t)}. Esto ofrece un mtodo de estimacin
inmediata de H(t) haciendo logaritmos a ambos lados H(t) = -logR(t). Un segundo mtodo de
estimacin de H(t) es usando el estimador de Nelson-Aalen y su varianza. En la figura 94 se muestra
un grfico con los resultados de la comparacin de la estimacin de la funcin de tasa de reparacin
acumulada por ambos mtodos. Se muestra una ligera diferencia desde el tiempo de reparacin de 1
da que va incrementndose paulatinamente, coincidiendo con una probabilidad de no reparabilidad
menor de un 18-20% (ver figura 90).

Figura 94. Comparativa de Mtodos de Estimacin de la Funcin de tasa de reparacin acumulada

IV.61
CaptuloIV.ResultadosyAnlisis

4.3.3.4. Ajuste de Datos Tiempo-Evento (no Reparabilidad) a Modelos Paramtricos


Se pueden obtener modelos paramtricos puntuales para la funcin de no reparabilidad, tasa de
reparacin y tasa de reparacin acumulado. Estos modelos son vlidos para un solo valor en el tiempo
para el cual se va a hacer la inferencia.
Dentro de la librera flexsurv de R, est la funcin flexsurvreg que crea modelos paramtricos para
datos de tiempo de que el dispositivo no este aun reparado (no reparabilidad). Los datos pueden ser
censurados por la derecha o truncados a la izquierda. Diferentes distribuciones paramtricas estn
disponibles para ser utilizadas.

4.3.3.4.1. Funcin de no Reparabilidad


Con la funcin flexsurvreg mediante la opcin "survival" (Apndice 4, apartado 3.3.4.1.) se puede
obtener la funcin de no reparabilidad con una serie de funciones paramtricas, como se indica en la
figura 95.

Figura 95. Funcin de no Reparabilidad con Modelos Paramtricos

De las 4 funciones de fiabilidad paramtricas propuestas, la funcin Lognormal presenta un mejor


ajuste hasta los 0.25 das, a partir de este punto seran las distribuciones weibull y Gamma las que
presentaran un ajuste ms acertado a la funcin de no reparabilidad

IV.62
CaptuloIV.ResultadosyAnlisis

4.3.3.4.2. Funcin de Tasa de Reparacin h(t)


En esta ocasin es necesaria la funcin muhaz, que estima la funcin de tasa de reparacin para
datos censurados a la derecha con la opcin "hazard" de la funcin flexsurvreg (Apndice 4, apartado
3.3.4.2.), en la figura 96 se muestra el resultado:

Figura 96. Funcin de Tasa de Reparacin con Modelos Paramtricos

Las funciones Exponencial y Gamma difieren del patrn mostrado por la funcin de tasa de
reparacin, principalmente la primera, ya que es conocido que la exponencial tiene una tasa de
reparacin constante en el tiempo. La funcin de weibull presenta una un buen ajuste pero no tiende
a cero como la funcin no paramtrica y finalmente la funcin lognormal presenta una grfica muy
ajustada a ambos lados de la funcin y tiende a cero con mayor intensidad que el resto de funciones
y de forma similar a la funcin de tasa de reparacin

4.3.3.4.3. Funcin de Tasa de Reparacin Acumulada


En esta ocasin se utilizada la funcin flexsurvreg y la opcin "cumhaz" de (Apndice 4, apartado
3.3.4.3.), mostrndose en la figura 97 el resultado obtenido:

IV.63
CaptuloIV.ResultadosyAnlisis

Figura 97. Funcin de Tasa de Reparacin Acumulada con Modelos Paramtricos

La Funcin de Lognormal y weibull seran las que presentaran un ajuste ms cercano a la funcin
en estudio. Las funciones Gamma y Exponencial difieren de la funcin de estudio principalmente a
partir de los 1.5 das.
Todos los grficos muestran en comn una grfica ptima de ajuste, que sera la distribucin
lognormal.

4.3.3.5. Estimacin No Paramtrica


Debido a que la distribucin que presenta un ajuste ms adecuado es la distribucin Lognormal, se
realizara a continuacin una estimacin de parmetros de esta ltima mediante la funcin survreg
mediante mxima verosimilitud MLE. En el apartado 3.3.5 del Apndice 4, se muestra su forma de
clculo, obteniendo de forma resumida los siguientes parmetros:
Des. Estand. = 1.376776 Media = -1.42255

Las funciones principales resultantes con los parmetros obtenidos, se muestran en las figuras 98-
100.

IV.64
CaptuloIV.ResultadosyAnlisis

Figura 98. Funcin de no Reparabilidad Figura 99. Funcin de Tasa de Reparacin

Figura 100. Funcin de Tasa de Reparacin Acumulada

Se ha podido identificar como las observaciones en el estudio no paramtricas se podran ajustar


a ciertas distribuciones paramtricas, identificando una de ellas (lognormal) y demostrando la
validez del procedimiento no paramtrico para realizar un anlisis adecuado de las observaciones y
un ajuste a distribuciones tericas.

4.3.4. Anlisis Comparativo no Paramtrico y Paramtrico.


La comparacin de los valores de los parmetros fue realizada en el apartado 4.3.2.5. Comparacin
de Mtodos de Estimacin de Parmetros. En las figuras 101-104 se realiza una exposicin resumen
de las grficas ms sobresalientes del anlisis no paramtricos y paramtrico.. Se puede observar una
gran similitud entre ellas, aunque se podra indicar las diferencias entre las grficas de la tasa de
reparacin h(t), siendo la no paramtrica irregular y tendiendo a cero con mayor incidencia que la
paramtrica.

IV.65
CaptuloIV.ResultadosyAnlisis

4.3.4.1. Funcin de Mantenibilidad M(t).

Figura 101. Funcin de Mantenibilidad M(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)

4.3.4.2. Funcin de no Reparabilidad Rr(t).

Figura 102. Funcin de no Reparabilidad Rr(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)

4.3.4.3. Funcin de Tasa de Reparacin h(t).

IV.66
CaptuloIV.ResultadosyAnlisis

Figura 103. Funcin de Tasa de Reparacin h(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)

4.3.4.4. Funcin de Tasa de Reparacin Acumulada H(t).

Figura 104. Funcin de Tasa de Reparacin Acumulada H(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)

4.4. Anlisis Disponibilidad


Los estudios realizados han sido para 80 dispositivos sin reparacin. Pero para realizar un ejemplo
didctico, se hace la asumpcin que los datos que se tienen corresponden a un nico dispositivo
reparable, por tanto los tiempos de TTF corresponden a TBF. Teniendo en cuenta los clculos
realizados para Media o Esperanza Matemtica = E[T] de los tiempos de operacin entre fallos MTBF
y la media de los tiempos de reparacin MTTR, se puede calcular la disponibilidad del dispositivo de
la siguiente forma considerando las expresiones ya analizados anteriormente.
Media o Esperanza Matemtica = E[T] de MTBF:

IV.67
CaptuloIV.ResultadosyAnlisis

1 1
E T 1 39.6759 1 56.19593
0.6299
Media o Esperanza Matemtica = E[T] de MTTR:
2
1.38153
1.282332
2 2
E T e
e
0.5715834

La disponibilidad de la mquina vendra dada por:


MTBF 56.19593
D(t ) 0.9899 99%
MTBF MTTR 56.19593 0.5715834
Teniendo como resultado una disponibilidad del dispositivo de un 99% aproximadamente.

4.5. Simulacin
4.5.1. Introduccin
Una vez obtenidos los parmetros para cada distribucin identificada (fiabilidad y mantenibilidad)
se pueden generar valores de la variable aleatoria que siguen dicha distribucin.
As se simulara los diferentes tiempos de hasta el fallo o de reparacin de los dispositivos. Estos
valores sern comparados con las distribuciones identificadas en cada caso mediante grficos Q-Q
para comprobar si el ajuste es adecuado a partir del estudio grafico de posicionamiento de los puntos
con respecto a la recta, siendo por tanto una confirmacin emprica de los anlisis realizados.

4.5.2. Variables Aleatorias de una Distribucin Weibull


4.5.2.1. Generacin de Variables Aleatorias de una Distribucin Weibull
Esta es una explicacin paso a paso de cmo calcular una funcin de transformacin que convierte
una variable aleatoria de una distribucin a otra distribucin mediante el mtodo de inversin. En
este caso se utiliza la distribucin de Weibull como la distribucin de destino.
La distribucin de Weibull se define mediante la funcin de densidad como sigue

1 x

x
fw x e

Los parmetros forma y escala sern mayores que cero. Para valores de x menores de cero, la
distribucin se define como cero.
Para determinar la transformacin, se comienza con la ley fundamental de transformacin de las
probabilidades para dos funciones de distribucin de probabilidad f(y) y p(x),

dx
f y dy p x dx o f y p x
dy

IV.68
CaptuloIV.ResultadosyAnlisis

Esto permite relacionar una variable aleatoria x de la funcin de distribucin p(x) con la variable
aleatoria y de la funcin de distribucin f(y). Si x es de una distribucin uniforme en [0, 1], entonces p
(x) es constante por lo que se tiene:
dx
f y
dy

La solucin a esta ecuacin es la integral definida de


y
f(y), x F y f z dz .
0

Esta relacin dara la variable aleatoria de partida, dada la variable aleatoria final. As que se tiene
que ser capaz de invertir la relacin, y G x .

La dificultad est en la determinacin de y = G(x) dado x = F(y), que puede hacer este problema
potencialmente inviable.
Para el caso de la distribucin de Weibull se puede determinar fcilmente la inversa.
A partir de:
y
x F y fw z dz
0

Entonces haciendo la integral se obtiene:



y


x F y 1 e

Ahora se tiene que invertir y escribir, y = G(x),



y 1

y y
x Fy 1e ln1 x ln1 x

1
y G x ln 1 x

Por ltimo, la transformacin vendra dada por:


1
y ln 1 x

El proceso comienza con la generacin de la variable aleatoria, x, que proviene de una distribucin
uniforme (en el rango de 0 a 1).
1
A continuacin, se aplica la transformacin anterior y ln 1 x para obtener una nueva

variable aleatoria independiente que tiene una distribucin de Weibull con una media y la varianza
que depende de los valores de forma y escala .

IV.69
CaptuloIV.ResultadosyAnlisis

4.5.2.2. Anlisis de Ajuste de Valores a la Distribucin Weibull.


Se realizara el anlisis 5 veces para cada una de las 3 muestras de 10, 20 y 40 observaciones de
tiempo hasta el fallo de la distribucin de weibull (, ) = (0.6299, 39.6759). Se representaran los
resultados en grficos Q-Q Plot y se analizara grficamente su ajuste. El test se realizara mediante una
aplicacin desarrollada en R. (Apndice 4, apartado 4.1). Los datos numricos obtenidos de la
simulacin se encuentran disponibles en el Apndice 3, apartado 1.

4.5.2.2.1. Resultados Grficos de Simulacin para una Muestra de n = 10


En la figura 105 se muestran las grficas para una muestra de 10 v.a. donde la grfica 10-1 se
muestra un outlier fuera de la tendencia del resto de puntos, la grfica 10-5 los puntos siguen una
tendencia clara pero no coincidente con la recta.

IV.70
CaptuloIV.ResultadosyAnlisis

Figura 105. Grficos Q-Q para una muestra de 10 Variables Aleatorias de una Distribucin de Weibull

4.5.2.2.2. Resultados Grficos de Simulacin para una Muestra de n = 20


En la figura 106 se muestran las grficas para una muestra de 20 v.a. donde las grficas 20-2, 20-3
y 20-5 presentan 1 outlier en cada una de ellas, pero se va observando una mayor alineacin de los
datos a la recta, sobre todo en su parte baja.

IV.71
CaptuloIV.ResultadosyAnlisis

Figura 106. Grficos Q-Q para una muestra de 20 Variables Aleatorias de una Distribucin de Weibull

4.5.2.2.3. Resultados Grficos de Simulacin para una Muestra de n = 40


En la figura 107 se muestran las grficas para una muestra de 400 v.a. donde las grficas 40-1 y 40-
2 presenta ciertos puntos alejados de la recta, pero es evidente una mayor alineacin de los datos a
la recta conforme aumenta la cantidad de la muestra.

IV.72
CaptuloIV.ResultadosyAnlisis

Figura 107. Grficos Q-Q para una muestra de 40 Variables Aleatorias de una Distribucin de Weibull

IV.73
CaptuloIV.ResultadosyAnlisis

4.5.2.2.4. Resumen de los Test de MSE y de las Pruebas de Bondad de Ajuste


Desde el punto de vista del error cuadrtico medio (MSE), se observa en la tabla 27 como este
aumenta con el tamao de la muestra pero hay una muestra que destaca en su grupo (40-2) por un
valor ms elevado.
Desde el punto de vista de la bondad del ajuste, la hiptesis nula es rechazada por el test de
Kolmogorov-Smirnov como aparecen dos resultados para las muestras 10-4 y 40-5, el p-value est por
debajo del nivel de significancia (5%), podra llegar a entenderse en una muestra pequea pero es
menos comprensible en una muestra de 40 elementos, si estos datos los comparamos con los
resultados grficos, estos ltimos indicaran que los datos se ajustaran a una distribucin de weibull.
Por lo tanto, se puede estar incurriendo en un error del tipo I si rechazamos la hiptesis nula siendo
verdadera.
En el caso de la prueba para la muestra 40-1, la hiptesis nula es rechazada por el test de Pearson
o Chi-Cuadrado. Esto se convierte en un error de tipo I ya que se est rechazando una hiptesis que
de antemano, es verdadera. En este caso se tiene un parmetro de escala elevado. Se recomienda
basarse en el test de Kolmogorov-Smirnov, siendo este una herramienta ms potente.

Tabla 27.Resumen de las Pruebas de Bondad de Ajuste de Tiempos hasta el Fallo

Simulacin - Generacion v.a de una distribucin weibull t = scale(-log(1-x))^(1/shape).


Fiabilidad - x es de una distribucin uniforme en [0, 1], = 0.6299 y = 39.6759.
- Se ACEPTA la hipotesis nula p-valor > 0.05 (nivel de significancia).
- Test de Chi-cuadrado para n > 30

PruebadeBondadeAjuste
Tamao Secuencia MSE Estadisticos K-Sp-value Chi-Cuadrado
C-M A-D K-S p-value Acep./Rech.H 0 p-value Acep./Rech.H 0
10 1 2.9215 0.0412 0.3125 0.1739 0.874 A no calculado
10 2 2.5860 0.0627 0.3582 0.1847 0.8251 A no calculado
10 3 2.3635 0.0382 0.2628 0.1864 0.8171 A no calculado
10 4 3.2498 0.0280 0.1858 0.5185 0.005032 R no calculado
10 5 2.5243 0.2364 0.0709 0.2005 0.746 A no calculado
20 1 5.5257 0.0341 0.2493 0.1723 0.5364 A no calculado
20 2 4.0794 0.0638 0.4192 0.2047 0.326 A no calculado
20 3 4.0857 0.0335 0.2938 0.1559 0.6595 A no calculado
20 4 4.8657 0.0325 0.2996 0.1447 0.7439 A no calculado
20 5 4.4608 0.0299 0.2768 0.1357 0.8083 A no calculado
40 1 8.8932 0.1661 0.8964 0.1508 0.2925 A 0.01578 R
40 2 12.0998 0.1209 0.7592 0.1396 0.3812 A 0.18045 A
40 3 9.7822 0.0299 0.2603 0.1223 0.5472 A 0.89260 A
40 4 9.5325 0.0411 0.2924 0.147 0.3209 A 0.25102 A
40 5 8.2751 0.0566 0.3857 0.2781 0.003152 R 0.00002 R

IV.74
CaptuloIV.ResultadosyAnlisis

4.5.3. Variables Aleatorias de una Distribucin Log-Normal


4.5.3.1. Generacin de Variables Aleatorias de una Distribucin Log-Normal
Mediante el mtodo de inversin se realizara una funcin de transformacin para convertir una
variable aleatoria de una distribucin a otra distribucin. En este caso la distribucin de destino ser
la lognormal.


Si se define X N , , entonces Y e tiene distribucin LN , . Su funcin de densidad
2 x 2

viene dada por:


1 ln y 2

1 2
fY y e
y 0
y 2
El esquema general para generar valores de esta distribucin seria el siguiente:
Generar un valor z de una distribucin N 0 ,1

Hacer x z

Tomar y e x

4.5.3.2. Anlisis de Ajuste de Valores a la Distribucin Log-Normal.


Se realizara el anlisis 5 veces para cada una de las 3 muestras de 10, 20 y 40 observaciones de
tiempo hasta el fallo de la distribucin Log-Normal (, 2) = (-1.38153, 1.28233). Se representaran los
resultados en grficos Q-Q Plot y se analizara grficamente su ajuste. El test se realizara mediante una
aplicacin desarrollada en R. (Apndice 4, apartado 4.2).Los datos numricos obtenidos de la
simulacin se encuentran disponibles en el Apndice 3, apartado 2.

4.5.3.2.1. Resultados Grficos de Simulacin para una Muestra de n = 10


En la figura 108 se muestran las grficas para una muestra de 10 v.a. donde las grficas 10-1 y 10-
2 se muestra un outlier fuera de la tendencia del resto de puntos, la grfica 10-5 los puntos siguen
una tendencia clara pero no coincidente con la recta.

IV.75
CaptuloIV.ResultadosyAnlisis

Figura 108. Grficos Q-Q para una muestra de 10 Variables Aleatorias de una Distribucin Log-Normal

IV.76
CaptuloIV.ResultadosyAnlisis

4.5.3.2.2. Resultados Grficos de Simulacin para una Muestra de n = 20


En la figura 109 se muestran las grficas para una muestra de 20 v.a. donde las grficas 20-1 y 20-
5 presentan 1 outlier en cada una de ellas, pero se va observando una mayor alineacin de los datos
a la recta, sobre todo en su parte baja.

Figura 109. Grficos Q-Q para una muestra de 20 Variables Aleatorias de una Distribucin Log-Normal

IV.77
CaptuloIV.ResultadosyAnlisis

4.5.3.2.3. Resultados Grficos de Simulacin para una Muestra de n = 40


En la figura 110 se muestran las grficas para una muestra de 40 v.a. donde como se ha
mencionado anteriormente, aparecen 1 outlier en las grficas 40-1 y 40-4, pero es evidente una mayor
alineacin de los datos a la recta conforme aumenta la cantidad de la muestra.

Figura 110. Grficos Q-Q para una muestra de 40 Variables Aleatorias de una Distribucin Log-Normal

IV.78
CaptuloIV.ResultadosyAnlisis

4.5.3.2.4. Resumen de los Test de MSE y de las Pruebas de Bondad de Ajuste


Desde el punto de vista del error cuadrtico medio (MSE), se observa en la tabla 28 una alta
variabilidad dentro de cada grupo de muestras, debido a al producirse NAN durante la ejecucin del
estimador de la funcin de probabilidad, por lo que la cantidad de datos para el anlisis queda
reducida, teniendo un rango para la muestra de 10 elementos entre 1 y 4.
Desde el punto de vista de la bondad del ajuste, no hay indicios para pensar que la hiptesis nula
pueda ser rechazada, si acaso la simulacin 20-5 tiene un p-value bajo en comparacin con el resto.

Tabla 28.Resumen de las Pruebas de Bondad de Ajuste de los Tiempos de Reparacin

Simulacin - Generacion v.a de una distribucinlognormal t=exp(meanlog+(sdlog*z)).


Mantenibilidad -z es de una distribucin normal en [0, 1], = -1.38153 y = 1.28233.
- Se ACEPTA la hipotesis nula p-valor > 0.05 (nivel de significancia).
- Test de Chi-cuadrado para n > 30

PruebadeBondadeAjuste
Tamao Secuencia MSE Estadisticos K-Sp-value Chi-Cuadrado
C-M A-D K-S p-value Acep./Rech.H 0 p-value Acep./Rech.H 0
10 1 0.0186 0.0844 0.6038 0.326 0.1906 A no calculado
10 2 8.8178 0.0375 0.2894 0.3549 0.1243 A no calculado
10 3 0.7716 0.0244 0.1995 0.2136 0.6768 A no calculado
10 4 5.0779 0.0335 0.2516 0.2397 0.5373 A no calculado
10 5 1.2820 0.0700 0.3665 0.3272 0.1873 A no calculado
20 1 16.7760 0.0799 0.5661 0.1892 0.4194 A no calculado
20 2 3.6272 0.0306 0.1955 0.1324 0.8299 A no calculado
20 3 9.0524 0.0752 0.4530 0.1731 0.5305 A no calculado
20 4 20.6274 0.0317 0.2176 0.1792 0.4868 A no calculado
20 5 18.9060 0.0661 0.4174 0.277 0.07551 A no calculado
40 1 11.2506 0.0481 0.3622 0.0921 0.8562 A 0.30126 A
40 2 11.9966 0.0420 0.3276 0.108 0.6986 A 0.58874 A
40 3 2.7781 0.0365 0.2740 0.0729 0.9731 A 0.34021 A
40 4 8.0324 0.0527 0.3420 0.1303 0.4666 A 0.54699 A
40 5 19.2480 0.0557 0.4239 0.1101 0.6768 A 0.19253 A

IV.79

Captulo V. Conclusiones Finales y Lneas de Investigacin


Futuras

CaptuloV.ConclusionesFinalesyLneasdeInvestigacinFuturas

5.1 Conclusiones Finales


En el presente trabajo se han cumplido el objetivo de realizar una introduccin a la confiabilidad y
principalmente en las reas de fiabilidad y mantenibilidad, a travs de anlisis descriptivos, no
paramtricos y paramtricos.
En cada apartado se ha buscado una interpretacin y justificacin de las decisiones que se tomaban
con el objetivo final de conseguir la distribucin terica optima con los parmetros adecuados
A lo largo del trabajo se presenta la forma de realizar este anlisis utilizando el software estadstico
R, siendo una herramienta que permite estimar los diferentes parmetros y obtener la informacin
necesaria. No solo se explica la manera de utilizar las funciones de las libreras, sino que tambin se
ha tenido cuidado de explicar cmo obtener la mayor informacin posible de estas, as como la
manera de mejorar la presentacin de la informacin grfica para su mejor interpretacin y
entendimiento al considerar que la aportacin visual facilita el anlisis del modelo.
El clculo de las distribuciones estadsticas (Weibull y Log-Normal) aplicadas a la fiabilidad y al
mantenimiento han sido muy interesantes y han servido para:
Conocer la forma de vida de los dispositivos y por tanto definir polticas de mantenimiento
preventivo-predictivo fundadas en los datos de las observaciones y no en datos aportados
por el fabricante cuya procedencia seria desconocida.
Permitir estimar el tiempo medio de fallo y de reparacin.
Permitira estimar la fiabilidad de los equipos en un intervalo de tiempo.
Permitira estimar los tiempos de que el dispositivo no est an reparado (no
reparabilidad).
Conociendo en la zona de vida que se encuentra el dispositivo, se podra tomar como referencia
para:
Optimizar el uso de los recursos fsicos y del equipo humano.
Optimizacin de los costes del departamento mantenimiento.
Estos son puntos interesantes que no se han abordado en este trabajo de forma prctica, su
aplicacin permitira conocer:
Los intervalos ptimos de mantenimiento preventivo asociado al mnimo coste econmico.
El intervalo ptimo de sustitucin econmica de equipos.
Ha quedado patente como parte de este estudio, la variabilidad que presentan los valores de los
parmetros dependiendo del mtodo (5) y la librera utilizada en su clculo en R, principalmente en
Fiabilidad (distribucin weibull), presentando similar problema en programas comerciales como
Minitab, Statgraphics Centurion XVI o Statistica.

V.2
CaptuloV.ConclusionesFinalesyLneasdeInvestigacinFuturas

Se ha demostrado la validez de los anlisis realizados mediante los resultados de la simulacin


realizada para fiabilidad y mantenibilidad. Demostrando los beneficios en tiempo o costes que ofrece
este tipo de herramientas.
Los procesos y herramientas utilizadas en este estudio son utilizadas en diversas disciplinas, como
en medicina y biologa las cuales han sido las ms favorecidas por la aplicacin de los modelos de
supervivencia, de hecho esta es la razn por la cual se llama indistintamente tiempo de vida al tiempo
de fallo. En compaas de seguros donde se pretende modelar la probabilidad de ocurrencia de algn
evento de inters con la finalidad de calcular la prima y suma asegurada de algn seguro particular,
ya sea de vida o daos. En sistemas de pensiones donde el inters se centra en la permanencia en las
actividades laborales o en seguros de vida, en la permanencia de una persona en un grupo asegurado.

5.2 Lneas de Investigacin Futuras


De las investigaciones realizadas e indicadas en este TFM, se sugieren algunas posibles vas futuras
de investigacin:
En el campo de optimizacin de los costes de mantenimiento, se propone lneas de
investigacin sobre:
o Los intervalos ptimos de mantenimiento preventivo asociado al mnimo coste
econmico.
o El intervalo ptimo de sustitucin econmica de equipos.
En fiabilidad se propone una posible va de investigacin la utilizacin de tcnicas de bootstrap,
para la cuantificacin (por intervalos de confianza) de la incertidumbre de la distribucin del
tiempo de vida de un dispositivo en modelos de prediccin no paramtricos.
En fiabilidad se proponen estudios de tcnicas muestreo finito mediante Cadenas de Markov.

V.3

Captulo VI. Referencias Bibliogrficas

CaptuloVI.ReferenciasBibliogrficas

Al-Fawzan M., 2000, Methods for Estimating the Parameters of the Weibull Distribution, Science
and Technology, Riyadh, Saudi Arabia.
Antonitsin A., 2012, Statistical Methods in Reliability Testing, Ms Thesis, Department of Statistics
and Actuarial Science, Simon Fraser University, Vancouver, Canada
Caldern. B, 2014, Introduccin a la Simulacin,
http://www.aladefe.org/simulacin/index_files/documentos/capitulo3.PDF, Universidad de
Antioquia, Colombia
Cao, R. y Jacome, M.A., 2004, Presmoothed kernel density estimator for censored data, Journal of
Nonparametric Statistics, 16, 289-309.
Condra, L., 2001, Reliability Improvement with Design of Experiments, Second Edition, Marcel
Dekker. New York.
Diez D., Sep. 2014, Survival Analysis in R, http://www.stat.ucla.edu/~david/teac/surv/
Eulalia G.P., 2009, Fiabilidad Industrial, Ediciones UPS.
Garca-Ligero M.J., 2014, Simulacin de Procesos Estocsticos, Master Univ. en Estadstica
Aplicada, UGR, Granada.
Garca-Ligero M.J., Sept. 2014, Simulacin Con R,
http://www.ugr.es/~proman/PDF/Simulacin_R.pdf, UGR, Granada.
Godoy A.M., 2009, Introduccin al Anlisis de Supervivencia con R, TFM. Facultad de Ciencias,
UNA, Mxico.
Griful E, 2004, Fiabilidad Industrial. Ediciones UPC, S.L.
Hermida J. J., 2007, Fiabilidad y Garanta en Procesos de Produccin, ETSII, Universidad de Vigo,
2007.
Jiang R. , Zuo, M.J. y Li, H.-X., 1999, Weibull and Inverse Weibull Models allowing negative weights.
Reliability Engineering and System Safety, No. 66, pp. 227-234.
Jones O.,.Maillardet R., 2009, IntroductIon to Scientific Programming and Simulation using R.,
Taylor & Francis Group, Boca Raton, USA.
Juan Prez A, Garca Martn R., 2007, Ingeniera Industrial, Universitat Oberta de Catalunya,
Barcelona.
Juan Prez A, Serrat C., 2006, Ingeniera Industrial, Universitat Politcnica de Catalunya, Barcelona.
Kalbfleish J., Prentice, R. L., 2002, The Statistical Analysis of Failure Life-time Data. John Wiley &
Sons, Inc.
Kapla E. L., Meier, P., 1958, Nonparametric estimation from incomplete observations, Journal of
the American Statistical Association, 53, 457-481.

V.2
CaptuloVI.ReferenciasBibliogrficas

Karian Z.,.Dudewicz E., 2011, Handbook of Fitting Statistical Distributions with R, Taylor & Francis
Group, Boca Raton, USA.
Knuth, D.E., 1981; The Art of Computer Programming, Volume 2 Seminumerical Algorithms,
Addison-Wesley, Reading Mass., 688 pages, ISBN 0-201-03822-6
Laure M., Dutang Ch, Sep. 2014., Fitting parametric univariate distributions to non censored or
censored data using the R fitdistrplus package, http://cran.r-
project.org/web/packages/fitdistrplus/index.html.
Lawless, J. F., 2003, Statistical Models and Methods for Lifetime Data. John Wiley & Sons, Inc..
Lawless, J., 2000, Statistics in Reliability, Journal of the American Statistical Association, 95, 989-
992.
Lee, E. T., Wenyu Wang, J., 2003, Statistical Methods for Survival Data Analysis. Wiley.
Mallor F., Santos J., 2014, Fiabilidad de Componentes y Sistemas, Universidad pblica de Navarra,
rea de Ingeniera Industrial, Pamplona.
Manzano G., 2011, Mtodos de Inferencia para la Distribucin Weibull: Aplicacin en Fiabilidad
Industrial, TFM, Mster en Tcnicas Estadsticas, Universidad de Vigo, Vigo.
Manzano G., 2013, Anlisis de Fiabilidad. Estudio Terico y Prctico con SPSS, TFM, Mster en
Estadstica Aplicada, Universidad de Granada, Granada.
Meeker W., Escobar, L., 1998, Statistical Methods for Reliability Data. John Wiley & Sons, New
York.
Mosquera J., 2009, Fiabilidad Industrial, EIISS, Universidad del Valle, Mxico.
Nachlas J. A, 1995, Fiabilidad, Isdefe (Publicaciones de Ingeniera de Sistemas).
Naya S., 2013, Fiabilidad estadstica: Estado del arte y nuevo retos, Revista cientfica Alammi, 1,
Jul-Dic, Espaa
Nelson W., 1972, Theory and Applications of Hazard Plotting for Censored Failure Data,
Technometrics. 14, 945-966.
Nelson W., 1982, Applied Lifedata Analysis. John Wiley & Sons, Inc..
Nelson, W., 2003, Recurrent Events Data Analysis for Product Repairs, Disease Recurrences, and
Other Applications. ASA-SIAM Series on Statistics and Applied Probability.
O'Connor P., Practical Reliability Engineering Wiley, 1985.Mtodo F(xi)
Prez R., 2014, Evaluacin de la Fiabilidad y Mantenimiento de Sistemas de Ingeniera, Master
Univ. en Estadstica Aplicada, UGR, Granada.
Pinheiro, J. and Bates, D., 1995, Approximations to the Log-likelihood Function in the Nonlinear
Mixed-Effects Model, Journal of Computational and Graphical Statistics, Vol. 4, No. 1 pp. 12-35.
Prabhakar Murphy , D.N. , Min, X., Jiang, R., 2004, Weibull Models. John Wiley & Sons, Inc..

V.3
CaptuloVI.ReferenciasBibliogrficas

Redondo J.C., 2007, Modelo Matemtico Optimo de Mantenimiento y Fiabilidad Aplicado a


Aviacin Comercial., PhD Tesis, Departamento de Matemtica Aplicada, UNED, Madrid.
Romero E., 2012, Estudio de Mejora del Mantenimiento Mediante la Aplicacin de la Distribucin
de Weibull a un Histrico de Fallos, TFM, Mster en Estadstica, UNED, Madrid.
Solano H., 2008, Anlisis de Supervivencia en Fiabilidad. Prediccin en Condiciones de Alta
Censura y Truncamiento: El Caso de la Redes de Suministro de Agua Potable, PhD Tesis,
Departamento de Estadstica e Investigacin Operativa. Universidad de Valencia. Valencia
UNE 200001-3-5, 2002, Gestin de la Confiabilidad, Parte 3-5: Condiciones para los Ensayos de
Fiabilidad y Principios para la Realizacin de Contrastes Estadsticos, AENOR, Madrid.
UNE 20654-6, 2000, Gua de Mantenibilidad de Equipos, Parte 6: Seccin 9: Mtodos Estadsticos
para la Evaluacin de la Mantenibilidad, AENOR, Madrid.
UNE-EN 60300-1, 2004, Gestin de la confiabilidad, Parte 1: Sistemas de Gestin de la
Confiabilidad, AENOR, Madrid.
UNE-EN 60300-3-11, 2013, Gestin de la Confiabilidad, Parte 3-11: Mantenimiento Centrado en la
Fiabilidad, AENOR, Madrid.
UNE-EN 60300-3-3, 2009, Gestin de la confiabilidad, Parte 3-3, clculo del Coste del Ciclo de
Vida, AENOR, Madrid.
UNE-EN 60300-3-4, 2011, Gestin de la confiabilidad, Parte 3-4: Gua para la Especificacin de los
Requisitos de Confiabilidad, AENOR, Madrid.
UNE-EN 61649, 2012, Anlisis de Weibull, AENOR, Madrid.
UNE-EN 61703, 2003, Expresiones matemticas para los trminos de fiabilidad, disponibilidad,
mantenibilidad y de logstica de mantenimiento, AENOR, Madrid.
UNE-IEC 60300-3-10, 2007, Gestin de la confiabilidad, Parte 3-10: Mantenibilidad, AENOR,
Madrid.
UNE-IEC 61649, 2004, Procedimiento para el contraste de bondad del ajuste, intervalos de
confianza y limites inferiores de confianza para datos distribuidos segn Weibull, AENOR, Madrid.
Vega J.C., 2009, Estadstica Aplicada, usando R, Facultad de Administracin de Empresas,
Universidad de Puerto Rico. Puerto Rico.
Villagarca T., 2009, Fiabilidad, Universidad Carlos III, Madrid
Villarroel H., 20010. Aplicaciones a la Ingeniera de Mantenimiento. Mxico
W.H., B.P. Flannery, S.A. Teukolsky, W.T. Vetterling, 1986; Numerical Recipes, The Art of Scientific
Computing, Cambridge University Press, Cambridge, 818 pages, ISBN 0-512-30811-9
Wang Y., 2009, A Simple Analysis Method of Products Lifetime Distribution, Modern Applied
Science, vol 3, n 3.

V.4
CaptuloVI.ReferenciasBibliogrficas

V.5

Apndices

Apndices

Apndice 1. Datos Utilizados


Los datos de este estudio fueron suministrados por el Dr. D. Rafael Prez Ocn, catedrtico de la
Facultad de Ciencias de Granada y profesor de la asignatura de Evaluacin de la Fiabilidad y
Mantenimiento de Sistemas de Ingeniera del Mster Universitario en Estadstica Aplicada de la UGR.

TTF TTR TTF TTR


1 77.83 0.1007 41 251.59 0.191
2 89.15 0.0868 42 77.25 1.0417
3 82.67 0.0938 43 5.68 0.134
4 40.92 0.1319 44 36.58 1.6097
5 73.11 0.0417 45 4.49 0.2014
6 102.93 0.0486 46 5.95 0.1597
7 70.07 0.75 47 1.03 0.0694
8 149.47 2.4583 48 12.8 0.1563
9 0.68 1.4306 49 0.83 0.0694
10 0.28 0.7535 50 351.25 0.6354
11 13.31 0.5938 51 310.83 0.1458
12 4.95 0.0799 52 36.15 0.0417
13 0.11 0.1875 53 56.99 0.059
14 1.65 0.0972 54 63.68 0.0868
15 4.69 0.25 55 7.81 0.0694
16 10.43 2.6007 56 322.8 1.125
17 1.97 0.0243 57 3.87 0.3819
18 72.4 0.8118 58 0.63 0.1181
19 1.96 0.0243 59 17.24 1.0486
20 2.11 0.6097 60 122.38 3.3333
21 0.31 0.7431 61 133.83 0.1042
22 1.69 0.5313 62 7.06 0.0208
23 12.52 0.1319 63 63.17 0.0208
24 13.06 0.0833 64 1.14 0.0625
25 1.06 0.1042 65 18.86 0.1285
26 1.63 0.125 66 24.85 0.8021
27 14.93 0.0833 67 14.33 0.0431
28 180.33 0.9757 68 1.73 0.059
29 50.12 0.6528 69 32.95 0.2396
30 10.31 2.5625 70 20.32 0.4028
31 18.25 3.8611 71 15.7 0.2917
32 2.94 0.0938 72 6.06 0.0764
33 199.07 0.0417 73 83.82 0.0104
34 32.84 0.2083 74 40.11 0.8854
35 72.87 1.8229 75 81.52 0.5417
36 54.11 2.1597 76 49.1 1.0208
37 0.68 0.4306 77 133.26 0.5833
38 41.48 0.4972 78 83.76 0.3299
39 178.13 1.9097 79 1.4 0.7986
40 114.93 0.2813 80 99.91 0.1528

VI.2
Apndices

VI.3
Apndices

Apndice 2. Tablas del Estimador de Kaplan-Meier (KM)


2.1. Fiabilidad - Tiempo hasta el Fallo

time n.risk n.event survival std.err lower 95% CI upper 95% CI


0.11 80 1 0.9875 0.0124 0.96315 1
0.28 79 1 0.975 0.0175 0.94079 1
0.31 78 1 0.9625 0.0212 0.92087 1
0.63 77 1 0.95 0.0244 0.90224 0.9978
0.68 76 2 0.925 0.0294 0.86728 0.9827
0.83 74 1 0.9125 0.0316 0.85058 0.9744
1.03 73 1 0.9 0.0335 0.83426 0.9657
1.06 72 1 0.8875 0.0353 0.81826 0.9567
1.14 71 1 0.875 0.037 0.80253 0.9475
1.4 70 1 0.8625 0.0385 0.78704 0.938
1.63 69 1 0.85 0.0399 0.77175 0.9282
1.65 68 1 0.8375 0.0412 0.75666 0.9183
1.69 67 1 0.825 0.0425 0.74174 0.9083
1.73 66 1 0.8125 0.0436 0.72697 0.898
1.96 65 1 0.8 0.0447 0.71235 0.8877
1.97 64 1 0.7875 0.0457 0.69786 0.8771
2.11 63 1 0.775 0.0467 0.68349 0.8665
2.94 62 1 0.7625 0.0476 0.66925 0.8558
3.87 61 1 0.75 0.0484 0.65511 0.8449
4.49 60 1 0.7375 0.0492 0.64108 0.8339
4.69 59 1 0.725 0.0499 0.62716 0.8228
4.95 58 1 0.7125 0.0506 0.61332 0.8117
5.68 57 1 0.7 0.0512 0.59958 0.8004
5.95 56 1 0.6875 0.0518 0.58593 0.7891
6.06 55 1 0.675 0.0524 0.57236 0.7776
7.06 54 1 0.6625 0.0529 0.55888 0.7661
7.81 53 1 0.65 0.0533 0.54548 0.7545
10.31 52 1 0.6375 0.0537 0.53216 0.7428
10.43 51 1 0.625 0.0541 0.51891 0.7311
12.52 50 1 0.6125 0.0545 0.50574 0.7193
12.8 49 1 0.6 0.0548 0.49265 0.7074
13.06 48 1 0.5875 0.055 0.47963 0.6954
13.31 47 1 0.575 0.0553 0.46667 0.6833
14.33 46 1 0.5625 0.0555 0.45379 0.6712
14.93 45 1 0.55 0.0556 0.44098 0.659
15.7 44 1 0.5375 0.0557 0.42824 0.6468
17.24 43 1 0.525 0.0558 0.41557 0.6344
18.25 42 1 0.5125 0.0559 0.40297 0.622
18.86 41 1 0.5 0.0559 0.39043 0.6096
20.32 40 1 0.4875 0.0559 0.37797 0.597
24.85 39 1 0.475 0.0558 0.36557 0.5844
32.84 38 1 0.4625 0.0557 0.35324 0.5718
32.95 37 1 0.45 0.0556 0.34098 0.559
36.15 36 1 0.4375 0.0555 0.32879 0.5462
36.58 35 1 0.425 0.0553 0.31667 0.5333

VI.4
Apndices

40.11 34 1 0.4125 0.055 0.30463 0.5204


40.92 33 1 0.4 0.0548 0.29265 0.5074
41.48 32 1 0.3875 0.0545 0.28074 0.4943
49.1 31 1 0.375 0.0541 0.26891 0.4811
50.12 30 1 0.3625 0.0537 0.25716 0.4678
54.11 29 1 0.35 0.0533 0.24548 0.4545
56.99 28 1 0.3375 0.0529 0.23388 0.4411
63.17 27 1 0.325 0.0524 0.22236 0.4276
63.68 26 1 0.3125 0.0518 0.21093 0.4141
70.07 25 1 0.3 0.0512 0.19958 0.4004
72.4 24 1 0.2875 0.0506 0.18832 0.3867
72.87 23 1 0.275 0.0499 0.17716 0.3728
73.11 22 1 0.2625 0.0492 0.16608 0.3589
77.25 21 1 0.25 0.0484 0.15511 0.3449
77.83 20 1 0.2375 0.0476 0.14425 0.3308
81.52 19 1 0.225 0.0467 0.13349 0.3165
82.67 18 1 0.2125 0.0457 0.12286 0.3021
83.76 17 1 0.2 0.0447 0.11235 0.2877
83.82 16 1 0.1875 0.0436 0.10197 0.273
89.15 15 1 0.175 0.0425 0.09174 0.2583
99.91 14 1 0.1625 0.0412 0.08166 0.2433
102.93 13 1 0.15 0.0399 0.07175 0.2282
114.93 12 1 0.1375 0.0385 0.06204 0.213
122.38 11 1 0.125 0.037 0.05253 0.1975
133.26 10 1 0.1125 0.0353 0.04326 0.1817
133.83 9 1 0.1 0.0335 0.03426 0.1657
149.47 8 1 0.0875 0.0316 0.02558 0.1494
178.13 7 1 0.075 0.0294 0.01728 0.1327
180.33 6 1 0.0625 0.0271 0.00946 0.1155
199.07 5 1 0.05 0.0244 0.00224 0.0978
251.59 4 1 0.0375 0.0212 0 0.0791
310.83 3 1 0.025 0.0175 0 0.0592
322.8 2 1 0.0125 0.0124 0 0.0368
351.25 1 1 0 NaN NaN NaN

VI.5
Apndices

2.2. Mantenimiento - Tiempo de no Reparabilidad

time n.risk n.event survival std.err lower 95% CI upper 95% CI


0.0104 80 1 0.9875 0.0124 0.96315 1
0.0208 79 2 0.9625 0.0212 0.92087 1
0.0243 77 2 0.9375 0.0271 0.88446 0.9905
0.0417 75 3 0.9 0.0335 0.83426 0.9657
0.0431 72 1 0.8875 0.0353 0.81826 0.9567
0.0486 71 1 0.875 0.037 0.80253 0.9475
0.059 70 2 0.85 0.0399 0.77175 0.9282
0.0625 68 1 0.8375 0.0412 0.75666 0.9183
0.0694 67 3 0.8 0.0447 0.71235 0.8877
0.0764 64 1 0.7875 0.0457 0.69786 0.8771
0.0799 63 1 0.775 0.0467 0.68349 0.8665
0.0833 62 2 0.75 0.0484 0.65511 0.8449
0.0868 60 2 0.725 0.0499 0.62716 0.8228
0.0938 58 2 0.7 0.0512 0.59958 0.8004
0.0972 56 1 0.6875 0.0518 0.58593 0.7891
0.1007 55 1 0.675 0.0524 0.57236 0.7776
0.1042 54 2 0.65 0.0533 0.54548 0.7545
0.1181 52 1 0.6375 0.0537 0.53216 0.7428
0.125 51 1 0.625 0.0541 0.51891 0.7311
0.1285 50 1 0.6125 0.0545 0.50574 0.7193
0.1319 49 2 0.5875 0.055 0.47963 0.6954
0.134 47 1 0.575 0.0553 0.46667 0.6833
0.1458 46 1 0.5625 0.0555 0.45379 0.6712
0.1528 45 1 0.55 0.0556 0.44098 0.659
0.1563 44 1 0.5375 0.0557 0.42824 0.6468
0.1597 43 1 0.525 0.0558 0.41557 0.6344
0.1875 42 1 0.5125 0.0559 0.40297 0.622
0.191 41 1 0.5 0.0559 0.39043 0.6096
0.2014 40 1 0.4875 0.0559 0.37797 0.597
0.2083 39 1 0.475 0.0558 0.36557 0.5844
0.2396 38 1 0.4625 0.0557 0.35324 0.5718
0.25 37 1 0.45 0.0556 0.34098 0.559
0.2813 36 1 0.4375 0.0555 0.32879 0.5462
0.2917 35 1 0.425 0.0553 0.31667 0.5333
0.3299 34 1 0.4125 0.055 0.30463 0.5204
0.3819 33 1 0.4 0.0548 0.29265 0.5074
0.4028 32 1 0.3875 0.0545 0.28074 0.4943
0.4306 31 1 0.375 0.0541 0.26891 0.4811
0.4972 30 1 0.3625 0.0537 0.25716 0.4678
0.5313 29 1 0.35 0.0533 0.24548 0.4545
0.5417 28 1 0.3375 0.0529 0.23388 0.4411
0.5833 27 1 0.325 0.0524 0.22236 0.4276
0.5938 26 1 0.3125 0.0518 0.21093 0.4141
0.6097 25 1 0.3 0.0512 0.19958 0.4004
0.6354 24 1 0.2875 0.0506 0.18832 0.3867
0.6528 23 1 0.275 0.0499 0.17716 0.3728
0.7431 22 1 0.2625 0.0492 0.16608 0.3589

VI.6
Apndices

0.75 21 1 0.25 0.0484 0.15511 0.3449


0.7535 20 1 0.2375 0.0476 0.14425 0.3308
0.7986 19 1 0.225 0.0467 0.13349 0.3165
0.8021 18 1 0.2125 0.0457 0.12286 0.3021
0.8118 17 1 0.2 0.0447 0.11235 0.2877
0.8854 16 1 0.1875 0.0436 0.10197 0.273
0.9757 15 1 0.175 0.0425 0.09174 0.2583
1.0208 14 1 0.1625 0.0412 0.08166 0.2433
1.0417 13 1 0.15 0.0399 0.07175 0.2282
1.0486 12 1 0.1375 0.0385 0.06204 0.213
1.125 11 1 0.125 0.037 0.05253 0.1975
1.4306 10 1 0.1125 0.0353 0.04326 0.1817
1.6097 9 1 0.1 0.0335 0.03426 0.1657
1.8229 8 1 0.0875 0.0316 0.02558 0.1494
1.9097 7 1 0.075 0.0294 0.01728 0.1327
2.1597 6 1 0.0625 0.0271 0.00946 0.1155
2.4583 5 1 0.05 0.0244 0.00224 0.0978
2.5625 4 1 0.0375 0.0212 0 0.0791
2.6007 3 1 0.025 0.0175 0 0.0592
3.3333 2 1 0.0125 0.0124 0 0.0368
3.8611 1 1 0 NaN NaN NaN

VI.7
Apndices

Apndice 3. Simulacin de Variables Aleatorias


3.1. Valores Numricos para la Distribucin Weibull

n = 10-1 n = 10-2 n = 10-3 n = 10-4 n = 10-5


46.635129 282.681951 7.3674017 129.65707 289.9676571
1.740729 5.360322 38.5951717 117.111625 78.4605343
11.903147 1.068169 17.0647996 177.216438 0.7541112
59.807371 1.642727 56.5674304 8.033403 22.1192842
9.381263 17.888075 36.9315708 64.940716 12.6898633
253.143701 137.837574 51.3176174 369.984729 818.2508089
24.261799 18.630829 1.34344 57.802519 16.3530584
5.712363 13.19676 15.9028551 59.682731 17.44049
25.169673 128.205964 147.7080485 188.693552 1.9443577
4.582927 23.766851 0.5377632 27.861303 5.2825021

n = 20-1 n = 20-2 n = 20-3 n = 20-4 n = 20-5


62.76051897 2.91779446 106.2247023 96.5139836 11.3900734
0.06332885 160.3339686 37.9263688 95.89702941 8.9042061
56.46999736 51.79803143 93.3418106 79.09790096 186.0081009
185.8847776 65.05038735 2.7460187 90.39213873 99.4719413
8.52112576 98.74541557 3.476626 14.90647988 3.8881653
62.7297553 36.10362894 1.4307019 49.49167292 16.6267971
19.29798291 1.35686907 19.3955596 6.50798236 48.9051364
310.657378 55.12290545 0.3165665 9.24414713 2.7933172
5.44340139 67.07085696 3.3876296 20.13590225 1039.854749
27.11326309 19.69803552 82.8741497 0.28011253 99.0234382
100.1466306 0.80785378 18.9563692 32.57099796 7.1413059
4.43209697 21.89187782 14.1111607 34.52152067 0.4375256
20.36511744 0.02522183 0.332679 16.05710137 19.0116933
4.49370894 252.3551024 27.7361767 22.69460851 24.0768951
24.01486465 278.548553 812.1538981 5.49538134 0.3630661
405.5360556 309.6760647 8.3475744 0.01422334 74.222535
95.74291486 0.22571441 108.1790465 5.27788816 62.4307048
99.16296722 163.0133837 0.5329936 262.887378 0.4075338
7.35782071 5.72255135 6.3617168 36.70588396 72.46931
13.01784422 35.24381819 121.1632601 139.6774808 123.9630886

VI.8
Apndices

n = 40-1 n = 40-2 n = 40-3 n = 40-4 n = 40-5


57.97758302 33.6925575 2.5019707 4.81E+01 13.1029185
0.49605635 2.7972916 10.08004088 2.23E+02 30.4412359
68.75338006 22.0632887 6.58685366 5.79E+00 1.0929591
37.97281354 69.6340347 48.31844859 4.57E-05 28.3253659
84.77247253 0.7752236 28.52141902 2.03E+01 15.267984
184.1288899 4.2950086 12.31867747 2.44E+01 13.9900631
152.4889433 295.7637473 18.81402558 3.98E+02 8.4365441
0.81795142 13.8534815 0.01511145 1.07E+02 11.3756622
47.33639056 14.5174245 86.72126859 1.72E+02 14.8475858
59.47227898 11.8562036 19.22919809 3.37E+01 0.5500609
66.59581977 234.3169916 50.58635381 9.00E+01 3.0386771
60.24671556 139.7489909 1.7809274 3.15E+02 1.2060474
0.87592554 35.8063194 121.8463315 8.65E+00 0.9817134
4.59928631 54.2565285 5.58031679 2.61E+01 52.2982637
39.20463387 14.5842402 24.52890252 1.95E+01 112.0794577
31.0891479 25.5130144 5.55296154 6.95E+01 4.0378235
33.89034793 2.0437531 37.52784793 2.78E+01 44.4261221
37.94532339 20.9776819 53.91490643 1.11E+02 0.3741395
2.82801716 19.9555534 20.37618917 2.86E+00 2.0490101
6.94515033 55.8150235 0.37764396 3.82E+01 0.6307213
41.98286458 8.7759386 10.85754567 7.15E+01 95.6395042
56.49795794 74.5944165 90.41735074 1.75E-01 14.4245824
9.75451214 44.7160227 17.34025408 6.79E+00 13.8857376
86.80723272 11.4505889 300.7153932 1.16E+00 40.6575682
12.87591373 5.30744 3.4314265 1.57E+00 88.6708778
114.6368905 254.136231 6.38412211 3.52E+01 2.464734
143.5444334 4.1604873 10.00307709 1.35E+01 2.5630559
83.97017581 212.8434333 27.99591972 3.52E+01 40.1721361
8.64388338 25.623885 11.879826 9.08E-02 2.3314546
0.02106103 20.9138713 7.9240499 5.03E+00 0.5919065
32.38571421 528.4385858 2.92265591 2.76E+02 32.05848
12.0909049 6.4739364 33.13108307 9.39E+01 8.4010867
0.57015294 30.336808 73.86098787 3.48E+01 8.8287432
0.1999014 26.6155849 0.02912766 6.26E+02 46.2232385
44.74746878 40.1239758 8.21968388 5.25E+01 0.2324273
4.99745464 8.3261828 105.5507481 1.58E+00 6.8315468
1.45910669 4.5356728 11.98496021 1.06E+01 103.3485366
3.49399076 6.7195933 1.90997537 3.57E+02 4.2021767
40.27310933 39.3695511 83.54151362 2.59E+01 14.5276981
26.28933034 102.5456009 48.79269196 1.81E+02 13.5758577

VI.9
Apndices

3.2. Valores Numricos para la Distribucin Log-Normal

n = 10-1 n = 10-2 n = 10-3 n = 10-4 n = 10-5


0.31908773 1.62149011 0.12186279 0.79046445 0.08453284
0.29002981 0.60309541 0.02005786 0.04119736 1.63106245
0.10255853 0.45454362 0.23535881 0.09099428 0.0410203
3.57771342 0.08877564 0.08232572 0.1646082 0.08348215
0.16420075 0.28390198 0.05747465 0.04870915 0.8741054
0.04405796 0.09199898 3.38522712 0.15165193 4.77913261
0.08048325 0.56615055 0.55264913 0.0885273 0.21044364
0.20560013 2.44573635 0.31602255 1.12890608 0.11571846
0.14487643 0.41875761 0.10102669 0.33671324 0.00916861
0.08612151 1.13213417 0.41099903 0.22108554 0.09376666

n = 20-1 n = 20-2 n = 20-3 n = 20-4 n = 20-5


0.168517117 1.89564129 0.23384853 0.08325108 1.3349862
0.096047427 0.64738327 0.03639776 2.18883784 0.542592
0.298196509 0.09233569 1.30850114 0.3993954 0.4133927
0.457153313 0.14754618 0.87484735 0.02889496 0.0322564
0.146158984 0.07941468 0.54459482 0.42658485 0.1473356
0.260002842 0.19761386 0.36212729 1.34575837 0.2905785
3.190732088 3.03637214 0.04864543 6.22483582 0.3315988
0.124941753 0.18027522 0.4850933 0.03013128 1.2634413
0.113657329 0.13267211 0.14806744 0.12527021 0.3897205
0.564746018 0.84049821 0.06557762 0.61951763 0.8472765
0.307662455 0.57873227 0.03315501 1.5124643 0.3960505
0.190363419 0.29227802 0.10060346 0.72010647 1.1360285
0.103707562 0.0904699 0.05355879 0.21633047 0.1345947
0.063706823 0.41444764 0.53846975 0.52224693 5.7624577
0.005357543 0.08549398 0.47674339 0.05346537 0.3580742
0.063129276 0.01602825 0.34405384 0.18129424 0.3276491
0.99912282 0.27394876 0.29207948 0.06181852 0.1851083
0.360374382 0.03440887 0.14303337 0.08039798 0.2740001
0.151235723 0.79527691 0.0597551 2.96017121 0.1511688
0.162783505 0.07092461 0.27317567 0.38341376 0.5178182

VI.10
Apndices

n = 40-1 n = 40-2 n = 40-3 n = 40-4 n = 40-5


0.2576941 0.68047708 0.23691746 0.0418127 0.329884093
0.11936767 0.04890011 0.92010161 0.017415002 0.029334909
0.06302526 0.01394194 0.24416921 0.011821527 1.35772628
0.05800303 1.67970603 0.37522225 0.21491447 1.376479437
0.71805254 0.13384332 6.25806419 0.593891584 0.067884695
0.22853267 1.19728028 0.06389926 0.250859889 0.119832802
0.67204605 0.16143817 0.15735138 0.695226084 1.080888492
0.14557359 0.0876423 0.55959975 0.084344594 1.004205691
0.07720735 0.38345595 0.08380814 1.328785677 0.118146231
2.22844228 0.02743661 0.18251684 0.092609059 0.409579541
0.30804593 0.14976672 0.26473292 0.320553028 0.001403803
0.01497733 1.72446362 0.44945783 0.406765057 0.053331408
0.77499183 0.45817513 1.02841103 0.141096956 0.131156882
0.07414713 0.34513022 2.73142402 0.061372066 1.411079123
0.08469295 0.23349329 0.38173125 0.882133179 0.183396463
0.47077458 0.01852478 0.09283182 0.006181342 0.22613642
0.09889849 5.00522431 0.11715044 0.496472907 0.140198525
0.11988653 0.13111337 0.17857305 0.709895055 0.139810818
0.52558177 0.55793421 0.01020827 0.510088251 2.923975165
0.10051682 0.53124495 0.11717376 0.05672606 0.391014678
0.52351396 0.03032859 0.54465984 0.37851849 1.078207403
0.57657483 1.71203758 0.01353126 0.16786712 0.027868165
0.09140604 0.21951892 0.37067042 0.083184465 0.036138298
0.21273447 0.13303701 0.19685284 6.701674889 0.452327587
0.25643384 0.93112351 0.03926757 0.051278477 0.279503437
1.234684 0.41994642 0.91766652 0.674765065 0.656431778
1.5078401 0.59599947 0.12383128 0.052596247 0.206361533
0.07874559 0.19820794 0.13146019 0.301511191 0.211927142
0.24196574 0.530032 0.30884694 0.844329502 0.634586287
0.23650404 0.11594038 0.16471544 0.349077657 1.206712505
0.08836005 0.66228093 0.37793005 0.185540699 0.572385738
0.43807887 1.31505192 0.0212589 0.093197883 0.107444747
1.92590294 0.02860405 1.25919914 0.801324721 2.379784734
0.21598002 0.46731279 0.01637848 0.23440408 0.187823169
0.41315823 0.32866575 1.00401695 0.212711602 0.525794877
0.67457872 1.46227876 0.1777984 0.024294037 0.152918426
0.13469062 2.72914593 0.28541687 0.023639387 0.212807059
0.01102841 0.16520627 0.76111125 0.304266004 0.43721863
1.58397975 0.2321116 0.07175168 0.188206038 4.599588749
0.12322661 0.23634469 1.67400984 0.174408367 0.202176762

VI.11
Apndices

Apndice 4. Software de Estadstica Aplicada Desarrollado en R


4.1. Distribuciones Estadsticas
#
##########################################################################
# Confiabilidad: Fiabilidad y Mantenibilidad #
##########################################################################
#
##########################################################################
# 1. Fundamentos Tericos - Distribuciones Estadsticas #
##########################################################################
#
##########################################################################
# 1.1 Distribucin Normal #
##########################################################################
#
# Funcin de densidad f(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
mean <- c(3, 3, 3, 3, 3)
sd <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=3, ", sigma,"=0.25")),
expression(paste(, mu, "=3, ", sigma,"=0.5")),
expression(paste(, mu, "=3, ", sigma,"=1")),
expression(paste(, mu, "=3, ", sigma,"=1.5")),
expression(paste(, mu, "=3, ", sigma,"=2")))
plot(range(x),c(0,1.75),type="n",xlab="t", ylab="Densidad f(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,dnorm(x, mean[i], sd[i],log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de distribucin F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
mean <- c(3, 3, 3, 3, 3)
sd <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=3, ", sigma,"=0.25")),
expression(paste(, mu, "=3, ", sigma,"=0.5")),
expression(paste(, mu, "=3, ", sigma,"=1")),
expression(paste(, mu, "=3, ", sigma,"=1.5")),
expression(paste(, mu, "=3, ", sigma,"=2")))
plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Distribucin F(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)

VI.12
Apndices

grid()
for (i in 1:5){
lines(x,pnorm(x, mean[i], sd[i], lower=TRUE,log=FALSE), col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de Fiabilidad R(t)=1-F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
mean <- c(3, 3, 3, 3, 3)
sd <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=3, ", sigma,"=0.25")),
expression(paste(, mu, "=3, ", sigma,"=0.5")),
expression(paste(, mu, "=3, ", sigma,"=1")),
expression(paste(, mu, "=3, ", sigma,"=1.5")),
expression(paste(, mu, "=3, ", sigma,"=2")))
plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Fiabilidad R(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,pnorm(x, mean[i], sd[i], lower=FALSE,log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
# funcin de riesgo o tasa de fallo h(t)=f(t)/R(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
mean <- c(3, 3, 3, 3, 3)
sd <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=3, ", sigma,"=0.25")),
expression(paste(, mu, "=3, ", sigma,"=0.5")),
expression(paste(, mu, "=3, ", sigma,"=1")),
expression(paste(, mu, "=3, ", sigma,"=1.5")),
expression(paste(, mu, "=3, ", sigma,"=2")))
plot(range(x),c(0,10),type="n",xlab="t", ylab="Riesgo o Tasa de fallo h(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,(dnorm(x, mean[i], sd[i], log=FALSE))/(pnorm(x,mean[i], sd[i], lower=FALSE,log=FALSE)),
col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#

VI.13
Apndices

# funcin de riesgo acumulado H(t)=-log(1-F(t))


par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
mean <- c(3, 3, 3, 3, 3)
sd <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=3, ", sigma,"=0.25")),
expression(paste(, mu, "=3, ", sigma,"=0.5")),
expression(paste(, mu, "=3, ", sigma,"=1")),
expression(paste(, mu, "=3, ", sigma,"=1.5")),
expression(paste(, mu, "=3, ", sigma,"=2")))
plot(range(x),c(0,6),type="n",xlab="t", ylab="Riesgo Acumulado H(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,-pnorm(x, mean[i], sd[i],lower=FALSE,log=TRUE), col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
##########################################################################
# 1.2 Distribucin Log-Normal #
##########################################################################
#
# funcin de densidad f(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
meanlog <- c(1, 1, 1, 1, 1)
sdlog <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=1, ", sigma,"=0.25")),
expression(paste(, mu, "=1, ", sigma,"=0.5")),
expression(paste(, mu, "=1, ", sigma,"=1")),
expression(paste(, mu, "=1, ", sigma,"=1.5")),
expression(paste(, mu, "=1, ", sigma,"=2")))
plot(range(x),c(0,1),type="n",xlab="t", ylab="Densidad f(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,dlnorm(x, meanlog[i], sdlog[i],log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de distribucin F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
meanlog <- c(1, 1, 1, 1, 1)

VI.14
Apndices

sdlog <- c(0.25, 0.5, 1, 1.5, 2)


colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=1, ", sigma,"=0.25")),
expression(paste(, mu, "=1, ", sigma,"=0.5")),
expression(paste(, mu, "=1, ", sigma,"=1")),
expression(paste(, mu, "=1, ", sigma,"=1.5")),
expression(paste(, mu, "=1, ", sigma,"=2")))
plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Distribucin F(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,plnorm(x, meanlog[i], sdlog[i], lower=TRUE,log=FALSE), col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de Fiabilidad R(t)=1-F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
meanlog <- c(1, 1, 1, 1, 1)
sdlog <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=1, ", sigma,"=0.25")),
expression(paste(, mu, "=1, ", sigma,"=0.5")),
expression(paste(, mu, "=1, ", sigma,"=1")),
expression(paste(, mu, "=1, ", sigma,"=1.5")),
expression(paste(, mu, "=1, ", sigma,"=2")))
plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Fiabilidad R(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,plnorm(x, meanlog[i], sdlog[i], lower=FALSE,log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de riesgo o tasa de fallo h(t)=f(t)/R(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
meanlog <- c(1, 1, 1, 1, 1)
sdlog <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=1, ", sigma,"=0.25")),
expression(paste(, mu, "=1, ", sigma,"=0.5")),
expression(paste(, mu, "=1, ", sigma,"=1")),
expression(paste(, mu, "=1, ", sigma,"=1.5")),
expression(paste(, mu, "=1, ", sigma,"=2")))
plot(range(x),c(0,2.5),type="n",xlab="t", ylab="Riesgo o Tasa de fallo h(t)",

VI.15
Apndices

cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,(dlnorm(x, meanlog[i], sdlog[i], log=FALSE))/(plnorm(x,meanlog[i], sdlog[i],
lower=FALSE,log=FALSE)), col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de riesgo acumulado H(t)=-log(1-F(t))
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
meanlog <- c(1, 1, 1, 1, 1)
sdlog <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=1, ", sigma,"=0.25")),
expression(paste(, mu, "=1, ", sigma,"=0.5")),
expression(paste(, mu, "=1, ", sigma,"=1")),
expression(paste(, mu, "=1, ", sigma,"=1.5")),
expression(paste(, mu, "=1, ", sigma,"=2")))
plot(range(x),c(0,5),type="n",xlab="t", ylab="Riesgo Acumulado H(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,-plnorm(x, meanlog[i], sdlog[i],lower=FALSE,log=TRUE), col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
##########################################################################
# 1.3 Distribucin Exponencial #
##########################################################################
#
# funcin de densidad f(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)

rate <- c(0.25, 0.5, 1, 1.5, 2)


colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, lambda, "=0.25")),
expression(paste(, lambda, "=0.5")),
expression(paste(, lambda, "=1")),
expression(paste(, lambda, "=1.5")),
expression(paste(, lambda, "=2")))
plot(range(x),c(0,1),type="n",xlab="t", ylab="Densidad f(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()

VI.16
Apndices

for (i in 1:5){
lines(x,dexp(x, rate[i],log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de distribucin F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)

rate <- c(0.25, 0.5, 1, 1.5, 2)


colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, lambda, "=0.25")),
expression(paste(, lambda, "=0.5")),
expression(paste(, lambda, "=1")),
expression(paste(, lambda, "=1.5")),
expression(paste(, lambda, "=2")))
plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Distribucin F(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,pexp(x, rate[i], lower=TRUE,log=FALSE), col = colors[i],lwd=2)
}
legend("bottomright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de Fiabilidad R(t)=1-F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
rate <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, lambda, "=0.25")),
expression(paste(, lambda, "=0.5")),
expression(paste(, lambda, "=1")),
expression(paste(, lambda, "=1.5")),
expression(paste(, lambda, "=2")))
plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Fiabilidad R(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,pexp(x, rate[i], lower=FALSE,log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de riesgo o tasa de fallo h(t)=f(t)/R(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))

VI.17
Apndices

x <- seq(0,6,len=1000)
rate <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, lambda, "=0.25")),
expression(paste(, lambda, "=0.5")),
expression(paste(, lambda, "=1")),
expression(paste(, lambda, "=1.5")),
expression(paste(, lambda, "=2")))
plot(range(x),c(0,3),type="n",xlab="t", ylab="Riesgo o Tasa de fallo h(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,(dexp(x, rate[i], log=FALSE))/(pexp(x, rate[i], lower=FALSE,log=FALSE)), col =
colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de riesgo acumulado H(t)=-log(1-F(t))
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
rate <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, lambda, "=0.25")),
expression(paste(, lambda, "=0.5")),
expression(paste(, lambda, "=1")),
expression(paste(, lambda, "=1.5")),
expression(paste(, lambda, "=2")))
plot(range(x),c(0,5),type="n",xlab="t", ylab="Riesgo Acumulado H(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,-pexp(x, rate[i],lower=FALSE,log=TRUE), col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
##########################################################################
# 1.4 Distribucin Weibull #
##########################################################################
#
# Scale(eta) = 1/lambda
#
# funcin de densidad f(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(0.5, 1, 1.5, 2.5, 3.44)
scale <- c(1, 1, 1, 1, 1)

VI.18
Apndices

colors <- c("black", "blue", "green", "red", "grey")


labels <-c(expression(paste(, beta, "=0.5, ", eta,"=1")),
expression(paste(, beta, "=1, ", eta,"=1")),
expression(paste(, beta, "=1.5, ", eta,"=1")),
expression(paste(, beta, "=2.5, ", eta,"=1")),
expression(paste(, beta, "=3.44, ", eta,"=1")))
plot(range(x),c(0,2),type="n",xlab="t", ylab="Densidad f(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,dweibull(x,shape[i], scale[i],log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de distribucin F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(0.5, 1, 1.5, 2.5, 3.44)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, beta, "=0.5, ", eta,"=1")),
expression(paste(, beta, "=1, ", eta,"=1")),
expression(paste(, beta, "=1.5, ", eta,"=1")),
expression(paste(, beta, "=2.5, ", eta,"=1")),
expression(paste(, beta, "=3.44, ", eta,"=1")))
plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Distribucin F(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()

for (i in 1:5){
lines(x,pweibull(x,shape[i], scale[i], lower=TRUE,log=FALSE), col = colors[i],lwd=2)
}

legend("bottomright", inset=.05, title ="Parmetros",


labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de Fiabilidad R(t)=1-F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(0.5, 1, 1.5, 2.5, 3.44)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, beta, "=0.5, ", eta,"=1")),
expression(paste(, beta, "=1, ", eta,"=1")),
expression(paste(, beta, "=1.5, ", eta,"=1")),
expression(paste(, beta, "=2.5, ", eta,"=1")),
expression(paste(, beta, "=3.44, ", eta,"=1")))

VI.19
Apndices

plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Fiabilidad R(t)",


cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,pweibull(x,shape[i], scale[i], lower=FALSE,log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de riesgo o tasa de fallo h(t)=f(t)/R(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(0.5, 1, 1.5, 2.5, 3.44)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, beta, "=0.5, ", eta,"=1")),
expression(paste(, beta, "=1, ", eta,"=1")),
expression(paste(, beta, "=1.5, ", eta,"=1")),
expression(paste(, beta, "=2.5, ", eta,"=1")),
expression(paste(, beta, "=3.44, ", eta,"=1")))
plot(range(x),c(0,3),type="n",xlab="t", ylab="Tasa de fallo h(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,(dweibull(x,shape[i], scale[i], log=FALSE))/(pweibull(x,shape[i], scale[i],
lower=FALSE,log=FALSE)), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de riesgo acumulado H(t)=-log(1-F(t))
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(0.5, 1, 1.5, 2.5, 3.44)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, beta, "=0.5, ", eta,"=1")),
expression(paste(, beta, "=1, ", eta,"=1")),
expression(paste(, beta, "=1.5, ", eta,"=1")),
expression(paste(, beta, "=2.5, ", eta,"=1")),
expression(paste(, beta, "=3.44, ", eta,"=1")))
plot(range(x),c(0,6),type="n",xlab="t", ylab="Riesgo acumulado H(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,-pweibull(x,shape[i], scale[i],lower=FALSE,log=TRUE), col = colors[i],lwd=2)
}

VI.20
Apndices

legend("topleft", inset=.05, title ="Parmetros",


labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
##########################################################################
# 1.5 Distribucin Gamma #
##########################################################################
#
# funcin de densidad f(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(0.5, 1, 1.5, 2.5, 3.44)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, beta, "=0.5, ", eta,"=1")),
expression(paste(, beta, "=1, ", eta,"=1")),
expression(paste(, beta, "=1.5, ", eta,"=1")),
expression(paste(, beta, "=2.5, ", eta,"=1")),
expression(paste(, beta, "=3.44, ", eta,"=1")))
plot(range(x),c(0,1),type="n",xlab="t", ylab="Densidad f(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,dgamma(x,shape[i], scale[i],log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de distribucin F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(0.5, 1, 1.5, 2.5, 3.44)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <- c(expression(paste(, beta, "=0.5, ", eta,"=1")),
expression(paste(, beta, "=1, ", eta,"=1")),
expression(paste(, beta, "=1.5, ", eta,"=1")),
expression(paste(, beta, "=2.5, ", eta,"=1")),
expression(paste(, beta, "=3.44, ", eta,"=1")))
plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Distribucin F(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,pgamma(x,shape[i], scale[i], lower=TRUE,log=FALSE), col = colors[i],lwd=2)
}
legend("bottomright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#

VI.21
Apndices

# funcin de Fiabilidad R(t)=1-F(t)


par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(0.5, 1, 1.5, 2.5, 3.44)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <- c(expression(paste(, beta, "=0.5, ", eta,"=1")),
expression(paste(, beta, "=1, ", eta,"=1")),
expression(paste(, beta, "=1.5, ", eta,"=1")),
expression(paste(, beta, "=2.5, ", eta,"=1")),
expression(paste(, beta, "=3.44, ", eta,"=1")))
plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Fiabilidad R(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,pgamma(x,shape[i], scale[i], lower=FALSE,log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de riesgo o tasa de fallo h(t)=f(t)/R(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(0.5, 1, 1.5, 2.5, 3.44)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <- c(expression(paste(, beta, "=0.5, ", eta,"=1")),
expression(paste(, beta, "=1, ", eta,"=1")),
expression(paste(, beta, "=1.5, ", eta,"=1")),
expression(paste(, beta, "=2.5, ", eta,"=1")),
expression(paste(, beta, "=3.44, ", eta,"=1")))
plot(range(x),c(0,3),type="n",xlab="t", ylab="Tasa de fallo h(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,(dgamma(x,shape[i], scale[i], log=FALSE))/(pgamma(x,shape[i], scale[i],
lower=FALSE,log=FALSE)), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de riesgo acumulado H(t)=-log(1-F(t))
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(0.5, 1, 1.5, 2.5, 3.44)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <- c(expression(paste(, beta, "=0.5, ", eta,"=1")),

VI.22
Apndices

expression(paste(, beta, "=1, ", eta,"=1")),


expression(paste(, beta, "=1.5, ", eta,"=1")),
expression(paste(, beta, "=2.5, ", eta,"=1")),
expression(paste(, beta, "=3.44, ", eta,"=1")))
plot(range(x),c(0,5),type="n",xlab="t", ylab="Riesgo acumulado H(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,-pgamma(x,shape[i], scale[i],lower=FALSE,log=TRUE), col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
##########################################################################
# 1.6 Distribucin Erlang #
##########################################################################
#
# Beta = k con k siempre entero.
#
# funcin de densidad f(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(1, 2, 3, 4, 5)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <- c(expression(paste("K=1, ", eta,"=1")),
expression(paste("K=2, ", eta,"=1")),
expression(paste("K=3, ", eta,"=1")),
expression(paste("K=4, ", eta,"=1")),
expression(paste("K=5, ", eta,"=1")))
plot(range(x),c(0,1),type="n",xlab="t", ylab="Densidad f(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,dgamma(x,shape[i], scale[i],log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de distribucin F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(1, 2, 3, 4, 5)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <- c(expression(paste("K=1, ", eta,"=1")),
expression(paste("K=2, ", eta,"=1")),
expression(paste("K=3, ", eta,"=1")),

VI.23
Apndices

expression(paste("K=4, ", eta,"=1")),


expression(paste("K=5, ", eta,"=1")))
plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Distribucin F(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,pgamma(x,shape[i], scale[i], lower=TRUE,log=FALSE), col = colors[i],lwd=2)
}
legend("bottomright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de Fiabilidad R(t)=1-F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(1, 2, 3, 4, 5)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <- c(expression(paste("K=1, ", eta,"=1")),
expression(paste("K=2, ", eta,"=1")),
expression(paste("K=3, ", eta,"=1")),
expression(paste("K=4, ", eta,"=1")),
expression(paste("K=5, ", eta,"=1")))
plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Fiabilidad R(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,pgamma(x,shape[i], scale[i], lower=FALSE,log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de riesgo o tasa de fallo h(t)=f(t)/R(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(1, 2, 3, 4, 5)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <- c(expression(paste("K=1, ", eta,"=1")),
expression(paste("K=2, ", eta,"=1")),
expression(paste("K=3, ", eta,"=1")),
expression(paste("K=4, ", eta,"=1")),
expression(paste("K=5, ", eta,"=1")))
plot(range(x),c(0,3),type="n",xlab="t", ylab="Tasa de fallo h(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){

VI.24
Apndices

lines(x,(dgamma(x,shape[i], scale[i], log=FALSE))/(pgamma(x,shape[i], scale[i],


lower=FALSE,log=FALSE)), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de riesgo acumulado H(t)=-log(1-F(t))
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(1, 2, 3, 4, 5)
scale <- c(1, 1, 1, 1, 1)
colors <- c("black", "blue", "green", "red", "grey")
labels <- c(expression(paste("K=1, ", eta,"=1")),
expression(paste("K=2, ", eta,"=1")),
expression(paste("K=3, ", eta,"=1")),
expression(paste("K=4, ", eta,"=1")),
expression(paste("K=5, ", eta,"=1")))
plot(range(x),c(0,5),type="n",xlab="t", ylab="Riesgo acumulado H(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,-pgamma(x,shape[i], scale[i],lower=FALSE,log=TRUE), col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#

VI.25
Apndices

4.2. Fiabilidad
#
##########################################################################
# Fiabilidad - Aplicacin prctica #
##########################################################################
#
##########################################################################
# Preparacin de los datos #
##########################################################################
#
setwd("E:/11_Master Estadstica/4_Asignaturas/2_Trabajo Fin Master/0_Practica")
#
datos <- read.table("TFM 2014 Datos.txt", header=TRUE, sep="\t", na.strings="NA",
dec=".", strip.white=TRUE)
datos
names(datos)
#
TTF <- datos[,1]
TTR <- datos[,2]
time<-TTF
#
#
##########################################################################
## 2. Anlisis de Fiabilidad ## #
##########################################################################
#
time
#
##########################################################################
# 2.1 Anlisis exploratorio de datos #
##########################################################################
#
# 2.1.1 Estadsticas bsicas
# Medidas de centralizacin
summary(time)
mode=function(r1){
q=table(r1)
q=sort(q,TRUE)
return(q[1])}
mode(time)
range=function(r2){
range<-max(r2)-min(r2)
out<-list(range=range, min=min(r2),max=max(r2))
return(out)
}
range(time)
quantile (time)
#
# Medidas de dispersin
var (time)
sd(time)

VI.26
Apndices

# Medidas de forma (asimetra, curtosis)


# install.packages("e0711")
library(e1071)
skewness(time, type = 2)
kurtosis(time, type = 2)
#
# 2.1.2 Anlisis grafico
# Diagrama de cajas
boxplot(time, ylab ="Tiempo (Das)", xlab ="Dispositivos", las = 2)
#
# Histograma con distribucin normal
dev.off()
h<-hist(time, breaks=15, col="red", xlab="Tiempo de Fallo (Das)", ylab="Frecuencia",
main="Histograma con Distribucin Normal",xaxt="n", yaxt="n",freq=TRUE)
axis(1, at=seq(0,400,by=50), labels=seq(00,400,by=50),cex.axis=.75 )
axis(2, at=seq(0,50,by=10), labels=seq(00,50,by=10),cex.axis=.75 )
xfit<-seq(min(time),max(time),length=50)
yfit<-dnorm(xfit,mean=mean(time),sd=sd(time))
yfit <- yfit*diff(h$mids[1:2])*length(time)
lines(xfit, yfit, col="blue",lwd=2)
#
#
#
##########################################################################
# 2.2 Anlisis no Paramtrico #
##########################################################################
#
# cargar la librera Survival
# install.packages("survival")
library("splines")
library("survival")
#
# la funcin Surv crea un objeto de supervivencia en el cual se captura
# el tiempo observado de la variable y su estado (censurado o no)
# Presenta los argumentos time y event. El argumento time corresponde
# al tiempo desde que el sujeto entra al estudio, hasta que este presenta
# el fallo o censura. El argumento event es una variable binaria que indica
# el estatus del tiempo registrado, donde, de forma predeterminada corresponde a
# 0 <- si el dato es censurado
# 1 <- si la falla es observada
#
# Debido que no se tiene informacin de datos censurados, se asumir un estudio
# con datos completos. Los dispositivos han fallado en el tiempo de control y,
# por tanto, su estado se representara por 1 en todos ellos.
event<-c(rep(1,80))
event
db<-data.frame(cbind(time, event))
db
#
##########################################################################
# 2.2.1. Estimacin de la funcin de supervivencia #
##########################################################################

VI.27
Apndices

#
# 2.2.1.1. Estimador de Kaplan-Meier
# La informacin del estimador de Kaplan-Meier para la funcin de supervivencia
# es obtenida de la siguiente forma
survfit(Surv(db$time, db$event)~ 1,type="kaplan-meier",
conf.type="none")
#
# Informacin adicional con la funcin summary
KM <- survfit(Surv(db$time, db$event)~ 1,type="kaplan-meier",
conf.type="none")
summary(KM)
#
# Obtener la informacin dada por summary en tiempos especficos,
time1 <- c(0,1,2,5,10,20,40,100,150,200)
summary(KM,time1)
#
# Atributos del objeto survfit
names(KM)
#
# Obtener los tiempos de fallo
summary(KM)$time
#
# Obtener los datos de supervivencia de los tiempos de fallo
summary(KM)$surv
#
# 2.2.1.2. Grafica de la funcin de supervivencia
# Se usa el argumento conf.int = F debido a que no se desea que muestre
# el intervalo de confianza estimado para la funcin de supervivencia
plot(KM,conf.int=F, main = "Funcin de supervivencia",
xlab= "Tiempo de Supervivencia (Das)",ylab="Probabilidad de Supervivencia",lwd=2,
col ="blue",xaxt="n", yaxt="n")
box(lwd=1.8, col = 'black')
axis(1, at=seq(0,400,by=50), labels=seq(00,400,by=50),cex.axis=.75 )
axis(2, at=seq(0,1,by=.1), labels=seq(0,1,by=.1),cex.axis=.75 )
abline(h = seq(0,1,.1), v = seq(0,400,25),lty=3,lwd=1,
col ="grey")
legend(200,0.9,c("Funcin de supervivencia"),lwd=2,lty=1,
col="blue", cex =.75, bty="n")
#
#
# 2.2.1.3. Intervalo de confianza para la funcin de supervivencia
# Se realiza con el argumento conf.type dentro de la funcin survfit
## La funcin de supervivencia estimada por medio del estimador de
# Kaplan-Meier y su intervalo de confianza
KM.ord <- survfit(Surv(db$time, db$event)~ 1,type="kaplan-meier",
, error="greenwood", conf.type="plain",conf.int=0.95)
KM.ord
# Informacin adicional
summary(KM.ord, conf.type = "plain")
#
# Intervalo de confianza con la funcin de Supervivencia estimada
plot(KM.ord, main = "Funcin de supervivencia", xlab= "Tiempo de Supervivencia (Das)",

VI.28
Apndices

ylab="Probabilidad de Supervivencia", col=c("blue", "green", "green"), lwd=1.8,


lty=c(1,3,3), cex =0.9,cex.axis=.75)
mtext("Mtodo de Kaplan-Meier - IC de 95%", side=3, cex=1)
grid()
legend(200,.9,
legend=c(expression(paste("Funcin de Supervivencia")),
expression(paste("Intervalo de Confianza"))),
col=c("blue", "green", "green"),cex = 0.75,
lwd=1.8,lty=c(1,3,3),bty="n")
#
#
# 2.2.1.4. Comparativa de Estimacin de la funcin de supervivencia
#
# a.- clculo del estimador Nelson-Aalen mediante regresin de cox,
# usando la funcin coxph
aa<- survfit(coxph(Surv(db$time, db$event)~1), type="aalen")
summary(aa)
h.aalen<-(-log(aa$surv))
aalen.est<-cbind(time=aa$time, d=aa$n.event, n=aa$n.risk,
h.aalen, s1=aa$surv)
#
# B.-Clculo del estimador kaplan-meier mediante survival
b<-survfit(Surv(db$time, db$event)~1, type="kaplan-meier")
km.est<-cbind(time=b$time, s2=b$surv)
#
# Generacin de base de datos conjunta
all<-merge(data.frame(aalen.est), data.frame(km.est), by="time")
all
#
# Grafica de comparacin
plot(all$time, all$s1, xlab="Tiempo de Supervivencia (Das)",
ylab="Probabilidad de Supervivencia",
main="Comparativa de Estimacin de Funcin de Supervivencia",
type="s",cex.axis=.75)
points(all$time, all$s1, pch=1)
lines(all$time, all$s2, type="s")
points(all$time, all$s2, pch=3)
legend(250, .9, c("Nelson-Aalen", "Kaplan-Meier"), pch=c(1, 3),cex =0.75, bty="n")
grid()
#
#
##########################################################################
# 2.2.2.Funcion de distr. o funcin probabilidad acumulada de fallo #
##########################################################################
#
# la funcin seria F(t)=1-S(t) o fun="event"
#
plot(KM.ord,fun = function(x) 1-x, main = "Funcin de Distribucin", xlab= "Tiempo de Fallo
(Das)",
ylab="Probabilidad Acumulada", col=c("blue", "green", "green"), lwd=1.8,
lty=c(1,3,3), cex =0.9,cex.axis=.75)
mtext("Mtodo de Kaplan-Meier - IC de 95%", side=3, cex=1)

VI.29
Apndices

grid()
legend(200,.2,
legend=c(expression(paste("Funcin de Distribucin")),
expression(paste("Intervalo de Confianza"))),
col=c("blue", "green", "green"),cex = 0.75,
lwd=1.8,lty=c(1,3,3),bty="n")
#
#
##########################################################################
# 2.2.3. Funcin de Riesgo Acumulado #
##########################################################################
#
# se utiliza como argumento de la funcin plot, fun = "cumhaz "
# Se usa el argumento conf.int = T debido a que se desea que muestre
# el intervalo de confianza estimado
KM1 <- survfit(Surv(db$time, db$event) ~ 1, type="kaplan-meier",
conf.type="log",conf.int=0.95)
plot(KM1, lty=c(1,3,3), fun="cumhaz", conf.int=T,
main = "Funcin de Riesgo Acumulado con Intervalos ",
xlab="Tiempo de Fallo (Das)", ylab="Riesgo Acumulado",lwd=1.7,
col="blue", cex =0.9,cex.axis=.75)
mtext("Mtodo de Kaplan-Meier - IC de 95%", side=3, cex=1)
grid()
legend(200,.9,
legend=c(expression(paste("Funcin de Riesgo Acumulado")),
expression(paste("Intervalo de Confianza"))),
col=c("blue", "blue", "blue"),cex = 0.7,
lwd=1.8,lty=c(1,3,3), bty="n")
#
#
## Comparativa de la Estimacin de la Funcin de Riesgo Acumulado
# La funcin de riesgo acumulado y la funcin
# de supervivencia estn relacionadas para datos continuos
# de la siguiente forma S(t) = exp {-H(t)}.
# Esto ofrece un mtodo de estimacin inmediata de h(t)
# haciendo logaritmos a ambos lados H(t) = -logS(t).
# Un segundo mtodo de estimacin de H(t) es usando el estimador
# de Nelson-Aalen y su varianza
#
# Opcin 1: Mediante -log S(t)(H.hat)
# No hay una funcin directa que realice el clculo en el paquete
# "survival", pero si puede ser realizado usando la salida de survfit():
H.fit <- summary(survfit(Surv(db$time, db$event) ~ 1))
#
# Funcin para evitar errores con datos
ldata <- function(v,MAX,MIN){pmin(MAX,pmax(MIN,v))}
H.fit$surv<-ldata(H.fit$surv,MAX=2,MIN=0.0001)
H.hat <- -log(H.fit$surv)
H.hat
H.hat <- c(H.hat, H.hat[length(H.hat)])
#
# Opcin 2: Mediante el estimador Nelson-Aalen (H.tilde)

VI.30
Apndices

h.sort.of <- H.fit$n.event / H.fit$n.risk


H.tilde <- vector()
for(i in 1:length(h.sort.of)) H.tilde[i] <- sum(h.sort.of[1:i])
H.tilde <- c(H.tilde, H.tilde[length(H.tilde)])
#
# Grafica de ambas opciones
yl<-range(ldata(c(H.hat, H.tilde),MAX=6,MIN=0.0001))
plot(c(H.fit$time, 350), H.hat, xlab="Tiempo de Fallo (Das)", ylab="Riesgo Acumulado",
main="Comparativa de Estimacin de Riesgo Acumulado", ylim=c(yl$min,yl$max),
cex.axis=.75,col="blue",lwd=2, type="s")
points(c(H.fit$time, 350), H.tilde, lty=2, ylim=c(yl$min,yl$max),type="s")
legend(175,6, legend=c("-logS(t)","Nelson-Aalen"), lty=1:2, col="blue",lwd=2,
cex =0.9, bty="n")
#
#
##########################################################################
# 2.2.4. Ajuste de datos tiempo-evento (super.) a modelos paramtricos #
##########################################################################
#
# Dentro del paquete flexsurv, est la funcin flexsurvreg que crea
# modelos paramtricos para datos de tiempo hasta el suceso
# (supervivencia). Los datos pueden ser censurados por la derecha o
# truncados a la izquierda. Diferentes distribuciones paramtricas
# estn disponibles.
#
# install.packages("flexsurv")
library(muhaz)
library(flexsurv)
#
sLno <- flexsurvreg(Surv(db$time, db$event)~1,dist='lnorm')
sexp <- flexsurvreg(Surv(db$time, db$event)~1,dist="exp")
sWei <- flexsurvreg(Surv(db$time, db$event)~1,dist='weibull')
sgano <- flexsurvreg(Surv(db$time, db$event)~1,dist='gamma')
#
# 2.2.4.1. Funcin de Supervivencia (Fiabilidad)
#
plot(sWei, type="survival", col.obs="black",
lty.obs=1,lwd.obs=1.9, col="red",
lwd=2, lty=1, cex.axis=.75)
title(main="Funcin de Supervivencia", col.main="navy",
xlab="Tiempo de Supervivencia (Das)", ylab="Probabilidad de Supervivencia",
col.lab="navy", cex.lab=0.9)

lines(sLno,type="survival", ci=NULL, col="green", lwd=2, lty=1)


lines(sexp, type="survival", ci=NULL, col="cyan", lwd=2, lty=1)
lines(sgano, type="survival", ci=NULL, col="blue",lwd=2, lty=1)
grid()
legend(200,.9,
legend=c(expression(paste("Funcin de supervivencia")),
expression(paste("Ajuste F. Fiab. Weibull")),
expression(paste("Ajuste F. Fiab. LogNormal")),
expression(paste("Ajuste F. Fiab. Exponencial")),

VI.31
Apndices

expression(paste("Ajuste F. Fiab. Gamma"))),


col=c("black", "red", "green", "cyan", "blue"), cex = 0.7,
lwd=2, lty=1, bty="n")
#
#
# 2.2.4.2. Funcin de Riesgo (Fallo)
## La funcin muhaz estima la funcin de riesgo para datos censurados
# a la derecha usando mtodos basados en kernel
#
ha1<-muhaz(db$time, db$event, min.time=0.0001, max.time=350)
plot(ha1, type="s", lty=1,lwd=1.8,xlab="", ylab="",
col="black",cex.axis=.75, xlim=c(0,355), ylim=c(0,0.04))
title(main="Funcin de Riesgo (Fallo)", col.main="navy",
xlab="Tiempo de Fallo (Das)", ylab="Tasa de Fallo h(t)",
col.lab="navy", cex.lab=0.9)

lines(sWei,type="hazard", ci=NULL, col="red", lwd=2, lty=1)


lines(sLno,type="hazard", ci=NULL, col="green", lwd=2, lty=1)
lines(sexp, type="hazard", ci=NULL, col="cyan", lwd=2, lty=1)
lines(sgano, type="hazard", ci=NULL, col="blue",lwd=2, lty=1)
grid()
legend(200,.04,
legend=c(expression(paste("Funcin de Riesgo (Fallo)")),
expression(paste("Ajuste F. Ries. Weibull")),
expression(paste("Ajuste F. Ries. LogNormal")),
expression(paste("Ajuste F. Ries. Exponencial")),
expression(paste("Ajuste F. Ries. Gamma"))),
col=c("black", "red", "green", "cyan", "blue"), cex = 0.7,
lwd=2, lty=1, bty="n")
#
#
# 2.2.4.2. Funcin de Riesgo (Fallo) Acumulado
#
plot(sWei, type="cumhaz", col.obs="black",
lty.obs=1,lwd.obs=1.9, col="red",
lwd=2, lty=1, cex.axis=.75)
title(main="Funcin de Riesgo (Fallo) Acumulado", col.main="navy",
xlab="Tiempo de Fallo (Das)", ylab="Tasa de Fallo H(t)",
col.lab="navy", cex.lab=0.9)

lines(sLno,type="cumhaz", ci=NULL, col="green", lwd=2, lty=1)


lines(sexp, type="cumhaz", ci=NULL, col="cyan", lwd=2, lty=1)
lines(sgano, type="cumhaz", ci=NULL, col="blue",lwd=2, lty=1)
grid()
legend(200,1.5,
legend=c(expression(paste("Funcin de Riesgo Acumulado")),
expression(paste("Ajuste F. Fallo Acum. Weibull")),
expression(paste("Ajuste F. Fallo Acum.. LogNormal")),
expression(paste("Ajuste F. Fallo Acum. Exponencial")),
expression(paste("Ajuste F. Fallo Acum. Gamma"))),
col=c("black", "red", "green", "cyan", "blue"), cex = 0.7,
lwd=1.8, lty=1, bty="n")

VI.32
Apndices

#
#
##########################################################################
# 2.2.5. Parametrizacion No Paramtrica #
##########################################################################
#
## Parametrizacin Weibull
#
# Hay mltiples maneras de paramtrica una distribucin Weibull.
# La funcin survreg lo realiza en una familia general de escala-localizacin
# que es una parametrizacin diferente a la funcin de rWeibull
# , y a menudo conduce a la confusin.
# scala en survreg = 1/(rweibull shape)
# intercept en survreg = log(rweibull scale)
# Para el log de mxima verosimilitud todas las parametrizaciones
# conducen al mismo valor.
# ejemplo clarificatorio
# y <- rweibull(1000, shape=2, scale=5)
# survreg(Surv(y)~1, dist="weibull")
#
# Los parmetros serian:
# scale = exp(Intercepct) en survreg
# El parmetro de forma es la inversa de la escala de los resultados
# en survreg. shape=1/escala
regr<-survreg(Surv(db$time, db$event)~ 1, dist = "weibull")
regr
scnp=exp(regr$coefficients)
shnp=1/regr$scale
scnp
shnp
#
x<-db$time
# par(mfrow = c(1,1))
# La Funcin de Supervivencia
curve(exp(-(x/scnp)^(shnp)), from=0,to=400,
main="Funcin de Supervivencia", ylab=expression(hat(S)(t)),
col="darkred",xlab="Tiempo de Supervivencia (Das)", lwd=2, ylim=c(0,1),cex.axis=.75)
leg<-as.factor(paste(c("shape =","scale ="),
c(round(shnp,3),round(scnp,3))))
legend(200,0.8, levels(leg), lwd=0.0001, lty=NULL, cex=.75,bty="n")
#
# Funcin de Riesgos
curve((shnp/scnp)*(x/scnp)^(shnp-1), from=0,to=400,
main="Funcin de Riesgo", ylab=expression(hat(h)(t)),
col="darkblue",xlab="Tiempo de Fallo (Das)", lwd=2,cex.axis=.75)
leg<-as.factor(paste(c("shape =","scale ="),
c(round(shnp,3),round(scnp,3))))
legend(200,0.03, levels(leg), lwd=0.0001, lty=NULL, cex=.75,bty="n")

#La Funcin Acumulada de Riesgo


curve((x/scnp)^(shnp), from=0,to=400,
ylab=expression(hat(H)(t)), main="Funcin Acumulada de Riesgo",

VI.33
Apndices

col="darkgreen",xlab="Tiempo de Fallo (Das)", lwd=2,cex.axis=.75)


leg<-as.factor(paste(c("shape =","scale ="),
c(round(shnp,3),round(scnp,3))))
legend(200,0.8, levels(leg), lwd=0.0001, lty=NULL, cex=.75,bty="n")
#
#

VI.34
Apndices

##########################################################################
# 2.3 Anlisis Paramtrico #
##########################################################################
#
##########################################################################
# 2.3.1. Anlisis Grfico #
##########################################################################
#
# Teniendo unas observaciones de una distribucin
# desconocida, se comparan con distribuciones conocidas
# para el ajuste de sus datos
#
# 2.3.1.1. Grficos de probabilidad o Q-Q
# Ajuste grafico de distribuciones de probabilidad o Q-Q
# instalacin de paquetes
# install.packages("MASS")
# install.packages("car")
library(MASS)
library(car)
library(splines)
library(survival)
library(fitdistrplus)
#
# En la funcin "fitdistr", los parmetros de la distribucin terica univariante
# son fijados libremente, realizndose por mxima verosimilitud.
# La funcin qqPlot () crea un grfico cuantil-cuantil
# para cualquier distribucin terica.
#
par(mfrow = c(3,2))
norm.fit <- fitdistr(time, "normal")
qqPlot(time, dist = "norm",
mean = norm.fit$estimate["mean"],
sd = norm.fit$estimate["sd"],
main="Q-Q Plot para una Distribucin Normal",
xlab="Quantiles de una Distribucin Normal",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue" )
#
lnorm.fit <- fitdistr(time, "lognormal")
qqPlot(time, dist = "lnorm",
meanlog = lnorm.fit$estimate["meanlog"],
sdlog = lnorm.fit$estimate["sdlog"],
main="Q-Q Plot para una Distribucin Log-Normal",
xlab="Quantiles de una Distribucin Log-Norma",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue")
#
fexp.fit <- fitdistr(time, "exponential")
qqPlot(time, dist = "exp",
rate = fexp.fit$estimate["rate"],
main="Q-Q Plot para una Distribucin Exponential",

VI.35
Apndices

xlab="Quantiles de una Distribucin Exponential",


ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue")
#
fwei.fit <- fitdistr(time, "weibull")
qqPlot(time, dist = "weibull",
shape = fwei.fit$estimate["shape"],
scale = fwei.fit$estimate["scale"],
main="Q-Q Plot para una Distribucin Weibull",
xlab="Quantiles de una Distribucin Weibull",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue")
#
fgam.fit <- fitdistr(time, "gamma")
qqPlot(time, dist = "gamma",
shape = fgam.fit$estimate["shape"],
rate = fgam.fit$estimate["rate"],
main="Q-Q Plot para una Distribucin Gamma",
xlab="Quantiles de una Distribucin Gamma",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue")
#
fpois.fit <- fitdistr(time, "poisson")
qqPlot(time, dist = "pois",
lambda = fpois.fit$estimate["lambda"],
main="Q-Q Plot para una Distribucin Poisson",
xlab="Quantiles de una Distribucin Poisson",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue")
#
detach ("package:car")
#
par(mfrow = c(1,1))
plot(density(time), main="Distribucin de Densidad"
, ylab="Densidad",lty=1,lwd=2, col ="blue",cex.axis=.75)
grid()
#
#
##########################################################################
# 2.3.1.2. Ajuste analtico Preliminar- Bondad de Ajuste #
# Copyright 2014 worldofpiggy.com (modificada) #
##########################################################################
#
# library(splines)
# library(survival)
# library(fitdistrplus)
# Se usara nuevamente la funcin "fitdistr" para la obtencin
# de los parmetros por mxima verosimilitud y el test de
# Kolmogorov-Smirnov para testear la bondad del ajuste
#
# El parmetro "sample", es el rango de la submuestra (0.5
# significa que el 50% de los datos sern considerados)

VI.36
Apndices

#
#Realizacin de funcin para el clculo de parmetros y bondad
# de ajuste K-S
#
fitData <- function(data, fit="gamma", sample=0.5){
distrib = list()
numfit <- length(fit)
results = matrix(0, ncol=6, nrow=numfit)
for(i in 1:numfit){
if((fit[i] == "gamma")|
(fit[i] == "poisson")|
(fit[i] == "weibull")|
(fit[i] == "exponential")|
(fit[i] == "lognormal")|
(fit[i] == "normal")
)
distrib[[i]] = fit[i]
else stop("Suministrar una distribucin vlida para el ajuste
de los datos" )
}
# Tomar la muestra del conjunto de datos
n = round(length(data)*sample)
data = sample(data, size=n, replace=F)
for(i in 1:numfit) {
if(distrib[[i]] == "gamma") {
gf_shape = "gamma"
fd_g <- fitdistr(data, "gamma")
est_shape = fd_g$estimate[[1]]
est_rate = fd_g$estimate[[2]]
Log_Likelihood = fd_g$loglik

ks = ks.test(data, "pgamma", shape=est_shape, rate=est_rate)


# Resultados de test de Bondad de Ajuste
results[i,] = c(gf_shape, round(est_shape,3), round(est_rate,3),
round(Log_Likelihood,3),
round(ks$statistic,3), round(ks$p.value,5))
}
else if(distrib[[i]] == "poisson"){
gf_shape = "poisson"
fd_p <- fitdistr(data, "poisson")
est_lambda = fd_p$estimate[[1]]
Log_Likelihood = fd_p$loglik

ks = ks.test(data, "ppois", lambda=est_lambda)


# Resultados de test de Bondad de Ajuste
results[i,] = c(gf_shape, round(est_lambda,3), "NA",
round(Log_Likelihood,3),
round(ks$statistic,3), round(ks$p.value,5))
}
else if(distrib[[i]] == "weibull"){
gf_shape = "weibull"
fd_w <- fitdistr(data, "weibull")

VI.37
Apndices

est_shape = fd_w$estimate[[1]]
est_scale = fd_w$estimate[[2]]
Log_Likelihood = fd_w$loglik

ks = ks.test(data, "pweibull", shape=est_shape, scale=est_scale)


# Resultados de test de Bondad de Ajuste
results[i,] = c(gf_shape, round(est_shape,3), round(est_scale,3),
round(Log_Likelihood,3),
round(ks$statistic,3), round(ks$p.value,5))
}
else if(distrib[[i]] == "normal"){
gf_shape = "normal"
fd_n <- fitdistr(data, "normal")
est_mean = fd_n$estimate[[1]]
est_sd = fd_n$estimate[[2]]
Log_Likelihood = fd_n$loglik

ks = ks.test(data, "pnorm", mean=est_mean, sd=est_sd)


# Resultados de test de Bondad de Ajuste
results[i,] = c(gf_shape, round(est_mean,3), round(est_sd,3),
round(Log_Likelihood,3),
round(ks$statistic,3), round(ks$p.value,5))
}
else if(distrib[[i]] == "exponential"){
gf_shape = "exponential"
fd_e <- fitdistr(data, "exponential")
est_rate = fd_e$estimate[[1]]
Log_Likelihood = fd_e$loglik

ks = ks.test(data, "pexp", rate=est_rate)


# Resultados de test de Bondad de Ajuste
results[i,] = c(gf_shape, round(est_rate,3), "NA",
round(Log_Likelihood,3),
round(ks$statistic,3), round(ks$p.value,5))
}
else if(distrib[[i]] == "lognormal"){
gf_shape = "lognormal"
fd_ln <- fitdistr(data, "lognormal")
est_mean = fd_ln$estimate[[1]]
est_sd = fd_ln$estimate[[2]]
Log_Likelihood = fd_ln$loglik

ks = ks.test(data, "plnorm", mean=est_mean, sd=est_sd)


# Resultados de test de Bondad de Ajuste
results[i,] = c(gf_shape, round(est_mean,3), round(est_sd,3),
round(Log_Likelihood,3),
round(ks$statistic,3), round(ks$p.value,5))
}
}
results = rbind(c("distribution", "param1", "param2", "Log_Likelihood",
"ks stat", "ks pvalue"), results)
#print(results)

VI.38
Apndices

return(results)
}
# Comparacin de datos con diversas distribuciones, Obteniendo K-S Stat
Aj <- fitData(time, fit=c("lognormal", "normal", "exponential",
"weibull", "gamma", "poisson"), sample=1)
#
colnames(Aj) = Aj[1, ] # la primera fila ser la cabecera
Aj = Aj[-1, ] # eliminar primera fila.
Aj1<-Aj[order(Aj[, 5]),]
Aj1
Aj2<-Aj[order(Aj[, 4]),]
Aj2
#
#
##########################################################################
# 2.3.1.3. Estimacin Grafica Paramtrica #
##########################################################################
#
# Se realizara la estimacin grafica de los parmetros de la distribucin
# Weibull, se comprobara el ajuste por el mtodo de regresin lineal
# mnimo-cuadrtica y analizara grficamente el ajuste
#
## Proceso de estimacin paramtrica
# Ordenar datos de tiempo
timeSort <- sort(time)
# calcular el nmero de datos
n <- length(time)
# Calcular el RANGO DE MEDIANA.
i <- 1:n
RM <- (i-0.3)/(n+0.4) # Rango de Mediana.
# Valores de (x, y) para el grfico.
Y <- function(d) {y <- log(log(1/(1-d))); y}
X <- log(timeSort)
# Crear tabla de datos.
tabla1 <- data.frame(i,timeSort, RM, X, Y(RM))
# Ajustar recta de regresin, limites de confianza y parmetros
lm1 <- lm(Y(RM)~X, data=tabla1)
# Estimacin Parmetros
sh_lm <- round (coef(lm1)[2], 4)
interc <- round (coef(lm1)[1], 4)
sc_lm <- round (exp(-(interc/sh_lm)), 4)
R2 <- round (summary(lm1)$r.squared, 4)
r <- round (cor(X, Y(RM)), 4)
#
# ## Generar la funcin de distribucin F(t) linealizada
# para la distribucin weibull.
# Para nuevos datos hay que adaptar xlim ().
par(mfrow = c(1,1))
plot (x=timeSort , y = Y(RM), log ="x", axes=F, lwd=2, cex=.75,
type="p", cex.lab =.9 ,
main=" Grfica de Weibull ",
xlim = c(0.1, 400),

VI.39
Apndices

ylim = Y(c(0.01, .9999)),


xlab = "Tiempo de Fallo (Das)",
ylab="F(t) Funcin acumulada de fallos (%)", col="red", pch=21)
# Graficar recta de ajuste
curve ((sh_lm*log(x))-(sh_lm*log(sc_lm)), add=TRUE, lwd=2, col="navy" )
#
ygrid <- round(c(seq(0.01,10.01, 2), seq(20, 80, 20),seq(99, 99, 0)),1)
# Adaptacin y ajuste de eje y, de logaritmos a presentacin en decimal
newygrid <- round((Y(ygrid/100)),1)
newygrid[newygrid==-Inf] <- -15
newygrid[newygrid==Inf] <- 1.7
newygrid[newygrid=="NaN"] <- 1.8
axis (2, newygrid ,ygrid, lwd=1.8, cex.axis=.75)
# ajustar
xgrid <- c(seq(.1, 1,.2), seq (2, 10, 2) , seq(20, 100, 10), seq(100, 400, 50) )
# clculo grfico de etha en eje x con el 63,2% en el eje y.
axis (1, lwd=1.8, cex.axis=0.75)
abline (v=xgrid , h= newygrid , col="grey" )
abline (lty =2,h=Y(1-exp(-1)) , col="blue" , lwd=2) #en escala ln ln
abline (lty =2, v=exp((Y(63.2/100) - interc) /sh_lm) , col="blue" , lwd=2) # en escala ln
#
# Grfica de recta de regresin para clculo de parmetros grficamente
library(car)
par(mfrow = c(1,1))
scatterplot(tabla1$X,tabla1$Y.RM., reg.line=F,
smooth=F, spread=T, boxplots=F,
xaxp=c(-2.5, 6.5, 9),yaxp=c(-6, 2, 16),
span=0.5, axes=T, lwd=1.8, cex=1, cex.lab =.9 ,cex.axis =.75,
xlim=c(-2.5,6.5), ylim=c(-6,2),
main=" Grfica de Weibull ",
xlab = "Tiempo de Fallo ( log(t) )",
ylab="Funcin acumulada de fallos (log(log(1/(1-F(t))))",
col="red", pch=21)
#
abline(lm1) ## recta de regresin
abline (h=0 , col="blue" ,lty =2, lwd=2) # ajuste manual y=0
abline (v=3.7 , col="blue" ,lty =2, lwd=2) # ajuste manual
# Lneas para clculo de la tang de alfa y beta
abline (h=1.55 , col="green" ,lty =2, lwd=2) # ajuste manual
abline (v=6.16, col="green" ,lty =2, lwd=2) # ajuste manual
# Lneas para clculo de eta
abline (v=0, col="darkmagenta" ,lty =2, lwd=2) # ajuste manual x=0
abline (h=-2.33 , col="darkmagenta" ,lty =2, lwd=2) # ajuste manual
# beta =tg alfa=y/x= 1.55/(6.16-3.7)= 0.6301
# eta=exp(-b/beta)=exp(-2.33/0.6301) = 40.3639
#
# Ajuste grafico a una distribucin por mxima verosimilitud
# Dentro del paquete fitdistrplus se encuentra la funcin plotdist,
# se podr graficar cualquier distribucin paramtrica indicando
# los valores de los parmetros especficos por medio de mxima verosimilitud
fmle <- fitdist(time, "weibull", method="mle")
plot(fmle)

VI.40
Apndices

#
# Evaluacin de residuos
layout(matrix(1:4,2,2))
plot(lm1)
#
#
##########################################################################
# 2.3.2 Estimacin Paramtrica puntual #
##########################################################################
#
##########################################################################
# 2.3.2.1. Estimacin Paramtrica puntual por Mnimos Cuadrados #
##########################################################################
#
# La estimacin fue realizada por razones prcticas en el apartado 2.3.1.3.
# Estimacin Grafica Paramtrica, reproduciremos en esta seccin
# la impresin de los parmetros
#
lm1
flsm <- c(sh_lm, sc_lm)
rlsm <- rbind(c("forma", "escala"),flsm)
colnames(rlsm) <- rlsm[1, ] # la primera fila ser la cabecera
rlsm <- rlsm[-1, ] # eliminar primera fila.
rlsm
#
#
##########################################################################
# 2.3.2.2. Estimacin Paramtrica puntual por Mxima Verosimilitud #
##########################################################################
#
# 2.3.2.2.1. clculo de las estimaciones para observaciones completas
# El paquete fitdistrplus permitir el clculo de los parmetros
# de la distribucin.
# library (fitdistrplus)
fmle <- fitdist(time, "weibull", method="mle")
fmle
#
# El paquete Renext, tambin podra ser utilizado para muestras completas.
# install.packages("evd")
# install.packages("numDeriv")
# install.packages("Renext")
library(evd)
library(numDeriv)
library(Renext)
rmle<-fweibull(time)
rmle
#
# 2.3.2.2.2. clculo de las estimaciones para observaciones con censura
# El paquete STAR permitir calcular mediante la funcin weibullMLE
# las estimaciones por el mtodo de mxima verosimilitud de los parmetros
# de la distribucin Weibull y permitir hacer estas estimaciones tanto
# para muestras completas como para muestras con censura tipo II.

VI.41
Apndices

# install.packages("STAR")
library(STAR)
# En el caso de muestras completas se definir "si" como
# numeric(length(yi))+1, que es el valor por defecto, pero en el
# caso de muestras censuradas tipo II, se reordenara la muestra con
# el comando sort y se definir "si" como c(rep(1,r),rep(0,n-r)),
# por lo que se tendr una muestra ordenada con r datos no censurados
# y n-r datos censurados.
wmle<-suppressWarnings(weibullMLE(time,
si=numeric(length(time))+1,shape.min=0.1,shape.max=5))
wmle$estimate
#
##########################################################################
# 2.3.2.3. Estimacin Paramtrica puntual por Momentos #
##########################################################################
#
# Mediante la funcin pelwei del paquete lmon es posible el clculos de los
# parmetros de la distribucin mediante el mtodo de momentos. Con la
# indicacin de bound=000, el clculo se realiza forzando el parmetro de
# localizacin a 0.
# install.packages("lmom")
library(lmom)
lmom <- samlmu(time, nmom=2)
# Para una distribucin weibull
pelwei(lmom ,bound=000)
#
#
##########################################################################
# 2.3.3 Estimacin Paramtrica por Intervalos #
##########################################################################
#
##########################################################################
# 2.3.3.1. Estimacin Paramtrica para Intervalos por Mnimos Cuadrados #
##########################################################################
#
# la estimacin por intervalos proporciona un intervalo dentro del cual hay
# una alta probabilidad (nivel de confianza) de que est contenido
# el verdadero valor del parmetro.
# library(car)
# el parmetro de forma y escala (scale) tendrn los siguientes valores para
# unos intervalos de confianza al 95%
ic<-confint(lm1, level=0.95)
ic
sh_lm_L<-round (ic[2,1], 4)
sh_lm_U<-round (ic[2,2], 4)
sc_lm_U <- round (exp(-(ic[1,1]/sh_lm)), 4)
sc_lm_L <- round (exp(-(ic[1,2]/sh_lm)), 4)
lsmi <- cbind(sh_lm, sh_lm_L, sh_lm_U,sc_lm, sc_lm_L, sc_lm_U)
rlsmi <- rbind(c("shape","shape_2.5%", "shape_97.5%", "scale", "scale_2.5%",
"scale_97.5%"),lsmi)
colnames(rlsmi) <- rlsmi[1, ] # la primera fila ser la cabecera
rlsmi <- rlsmi[-1, ] # eliminar primera fila.

VI.42
Apndices

rlsmi
#
# Grafica para intervalos
#
# Intervalos de Confianza y Prediccin con valores originales de X
# (tiempos ordenados)
# X <- log(timeSort)
# lm1 <- lm(Y(RM)~X, data=tabla1)
p_conf1 <- predict(lm1,interval="confidence", level = 0.95)
p_pred1 <- predict(lm1,interval="prediction", level = 0.95)
tabod<-data.frame(X,p_conf1,p_pred1) # Intervalos con valores originales
#
# Intervalos de Conf. y Pred, con nuevos valores de X (extrapolados
# y ms finamente/uniformemente espaciados que los datos originales)
nd <- data.frame(X = seq(0, 4))
p_conf2 <- predict(lm1,interval="confidence",newdata=nd)
p_pred2 <- predict(lm1,interval="prediction",newdata=nd)
tabnd<-data.frame(nd,p_conf2,p_pred2)# Intervalos con nuevos valores
#
# Grfica de recta de regresin con lmites
library(car)
par(mfrow = c(1,1))
scatterplot(tabla1$X,tabla1$Y.RM., reg.line=F,
smooth=F, spread=F, boxplots="xy",
xaxp=c(-2.5, 6.5, 9),yaxp=c(-6, 2, 8),
span=.5, axes=T, lwd=1.8, cex=1, cex.lab =1 ,cex.axis = .9,
xlim=c(-2.5,6.5), ylim=c(-6,2),
main=" Grfica de Weibull ",
xlab = "Tiempo de Fallo ( log(t) )",
ylab="Funcin acumulada de fallos (log(log(1/(1-F(t))))",
col="red", pch=21)
abline(lm1) ## recta de regresin
#
matlines(tabod$X,tabod[,c("lwr","upr")],col=2,lty=1,type="l",pch="+")
matlines(tabod$X,tabod[,c("lwr.1","upr.1")],col=2,lty=2,type="l",pch=1)
#
matlines(tabnd$X,tabnd[,c("lwr","upr")],col=4,lty=1,type="l",pch="+")
matlines(tabnd$X,tabnd[,c("lwr.1","upr.1")],col=4,lty=2,type="l",pch=1)
#
legend(3,-3.5,
legend=c(expression(paste("Interv. Conf./Pred. val. orig. de t")),
expression(paste("Interv. Conf./Pred. val. nuevos de t"))),
col=c("red", "blue"),cex = 0.7,
lwd=1.8,lty=c(2,2),bty="n")
#
#
##########################################################################
# 2.3.3.2. Estimacin Par. para Intervalos por Mxima Verosimilitud #
##########################################################################
#
# Obtencin de los intervalos de confianza basados en el test de
# razn de verosimilitudes para los parmetros de la distribucin

VI.43
Apndices

# del conjunto de datos.


#
# Dentro del Paquete Sim.DiffProc se encuentra la funcin Ajdweibull,
# que proporcionar intervalos de confianza para el modelo Weibull,
# cuando se trabaje con muestras de datos no censuradas
#
# install.packages("Sim.DiffProc_2.5.zip",repos=NULL)
# remove.packages(Sim.DiffProc,lib)
# install.packages("scatterplot3d")
library(scatterplot3d)
library(rgl)
library(Sim.DiffProc)
#
imle<-Ajdweibull(time,starts=list(shape=.1,scale=1),leve=0.95)
imle<-cbind(round(imle$coef,4),round(imle$confint,4))
imle
#
#
##########################################################################
# 2.3.3.3. Estimacin Par. para Intervalos por Momentos #
##########################################################################
#
# Con esta aplicacin se posible la estimacin de intervalos para los
# parmetros de una distribucin de Weibull con bootstraping por MOM
# install.packages("rootSolve")
library(rootSolve)
X<-time
# rango de posibles parmetro de "forma"
min_shape <- 0.1
max_shape <- 100
# bootstraping
Nboot <- 10000
sim <- replicate(Nboot, {
Xboot <- sample(X, replace=TRUE)
# buscar forma
rt <- 1+(sd(Xboot)/mean(Xboot))^2
rootFct <- function(k) {
gamma(1+2/k)/gamma(1+1/k)^2 - rt
}
shape_est <- uniroot.all(rootFct, c(min_shape, max_shape))
if (length(shape_est)!=1)
stop("El parmetro de forma puede estar fuera del min y max")
scale_est <- mean(Xboot)/gamma(1+1/shape_est)
c(shape=shape_est, scale=scale_est)
})
apply(sim, 1, function(x)
c(est=mean(x), se=sd(x), quantile(x, c(.025, .5, .975))))
#
#
##########################################################################
# 2.3.4 Comparativa de Mtodos de Clculo #
##########################################################################

VI.44
Apndices

#
#
cpar<-function(time,shape=1,scale=1 )
{ timeSort <- sort(time)
n <- length(time)
i <- 1:n
RM <- (i-0.3)/(n+0.4) # Rango de Mediana .
Frm <- RM
Fhrm <- 1-exp(-((timeSort/scale)^shape))
Fi<-(Fhrm-Frm)^2
Fi<-data.frame(Fi)
MSE<-sum(Fi, na.rm=TRUE)
tabla=cbind(i,timeSort,Frm,Fhrm,Fi)
MSE = cbind(MSE)
print(tabla)
print(MSE)
}
cpar(time,shape= 0.6604795 , scale= 41.0085335 )
#
#
##########################################################################
# 2.3.5. Test de Bondad de ajuste a una distribucin #
##########################################################################
#
##########################################################################
# 2.3.5.1. Test de Bondad para estimacin por Mnimos Cuadrados #
##########################################################################
#
# Evaluacin de resultado de la regresin
summary(lm1)
# Anlisis de varianza del modelo de regresin lineal
# Estudio de la relacin lineal entre ambas variables
anova(lm1)
# Test de independencia lineal y correlacin lineal r
cor.test(tabla1$X, tabla1$Y.RM., alternative="two.sided", method="pearson")
#
#
##########################################################################
# 2.3.5.2. Test de la Bondad mediante estadsticos #
##########################################################################
#
# 2.3.5.2.1. Aplicacin Conjunta de diversos Test
# Mediante la funcin gofstat del paquete fitdistrplus se realiza
# la estimacin de la bondad de ajuste para distribuciones continuas mediante
# los estadsticos de Cramer-von Mises, Kolmogorov-Smirnov y Anderson-Darling.
#
# Para conjunto de observaciones de n > 5 y distribuciones continuas,
# los test de Cramer-von Mises y Anderson-Darling se realizan sin conocimiento
# de los parmetros de la distribucin. El resultado ser la decisin de rechazar
# o no la distribucin terica con un nivel de significancia de 0.05.
# Ambos test se realizan por mxima verosimilitud
#

VI.45
Apndices

# Cuando se ajustan distribuciones discretas el estadstico chi-cuadrado es


# utilizado con la misma funcin pero con el argumento chisqbreaks o meancount.
#
testData <- function(x, y="weibull", shape=shape,scale= scale){
n<-length(x)
if (n <= 30) {
# test de K-S.
tmle <- suppressWarnings(fitdist(x, "weibull", method="mle"))
st <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=FALSE)
library(Sim.DiffProc)
ks<-suppressWarnings(test_ks_dweibull(x, shape,scale))
if (ks[2] > 0.05) {
res <- data.frame(n, shape, scale, st$cvm, st$cvmtest, st$ad, st$adtest,
st$ks, st$kstest, row.names = "Resultados")
print(res)
writeLines("\n Se ACEPTA la hiptesis nula p-valor > 0.05 (nivel de significancia).
Los datos siguen una distribucin de Weibull segn test Kolmogorov Smirnov.")
} else {
res <- data.frame(n, shape, scale, st$cvm, st$cvmtest, st$ad, st$adtest,
st$ks, st$kstest, row.names = "Resultados")
print(res)
writeLines("\n Se RECHAZA la hiptesis nula p-valor < 0.05 (nivel de significancia).
Los datos NO siguen una distribucin de Weibull segn test Kolmogorov Smirnov.")
}
} else {
# test de Chi-cuadrado
tmle <- suppressWarnings(fitdist(x, "weibull", method="mle"))
chi <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=FALSE)
if (chi$chisqpvalue > 0.05) {
res <- data.frame( n, shape, scale, chi$chisqpvalue,
row.names = "Resultados")
print(res)
writeLines("\n Se ACEPTA la hiptesis nula p-valor > 0.05 (nivel de significancia).
Los datos siguen una distribucin de Weibull segn test Chi-cuadrado.")
} else {
res <- data.frame(n, shape, scale, chi$chisqpvalue,
row.names = "Resultados" )
print(res)
writeLines("\n Se RECHAZA la hiptesis nula p-valor < 0.05 (nivel de significancia).
Los datos NO siguen una distribucin de Weibull segn test Chi-cuadrado.")
}
}
}
#
shape <- 0.6299
scale <- 39.6759
testData(time,y= "pweibull", shape=shape,scale= scale)
#
#
# 2.3.5.2.2. Test Individual de Kolmogorov Smirnov
# Mediante la funcin test_ks_dweibull del paquete Sim.DiffProc se
# realiza el test de bondad de ajuste de Kolmogorov Smirnov para contrastar si

VI.46
Apndices

# un conjunto de datos sigue o no un modelo de distribucin Weibull.


library(Sim.DiffProc)
ks<-test_ks_dweibull(time, shape=shape, scale= scale)
res <- data.frame(n, shape, scale, ks[1], ks[2],
row.names = "Resultados" )
res
#
# EL valor del estadstico obtenido de Ks es de 0,0792 que se comparara con el
# establecido en la tabla para un nivel de significacin de 5% y una muestra
# de 80 (ir a tabla K-S) D(0.05,80)=1.36/(raiz2(80))= 0.1521.
# Dado que el estadstico (0,0792) es menor que el valor de la tabla(0,1521),
# no se puede rechazar la hiptesis de que las observaciones no sigan
# la distribucin terica.
#
# Donde si el p-valor es mayor que el nivel de significancia de 0.05
# Se puede afirmar que el conjunto de datos sigue una distribucin Weibull
#
#
##########################################################################
# 2.3.6 Propiedades de Fiabilidad para Distribucin Weibull #
##########################################################################
#
# Scale(eta) = 1/lambda
# 2.3.6.1 Graficas de la distribucin de weibull
x <- time
shape <- 0.6299
scale <- 39.6759
col <- "blue"
labels <-c(expression(paste(, beta, " = 0.6299, ", eta," = 39.6759 ")))
#
# funcin de densidad f(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
curve(dweibull(x, shape = shape, scale = scale,log=FALSE), xlim=c(0,round(max(x),0)),
type="l",xlab="Tiempo de Fallo (Das)",
ylab="Densidad f(t)", cex.lab = 1.2, cex.main=1, cex.axis = 0.75,
col = col,lwd=2)
grid()
legend("right", inset=.05, title ="Parmetros",
labels, lwd=2, lty=1, cex =0.8, col= col, bty="n")
#
# funcin de distribucin F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
curve(pweibull(x, shape = shape, scale = scale,lower=TRUE,log=FALSE), xlim=c(0,round(max(x),0)),
type="l",xlab="Tiempo de Fallo (Das)",
ylab="Distribucin F(t)", cex.lab = 1.2, cex.main=1, cex.axis = 0.75,
col = col,lwd=2)
grid()
legend("right", inset=.05, title ="Parmetros",
labels, lwd=2, lty=1, cex =0.8, col= col, bty="n")
#
# funcin de Fiabilidad R(t)=1-F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))

VI.47
Apndices

curve(pweibull(x, shape = shape, scale = scale,lower=FALSE,log=FALSE),


xlim=c(0,round(max(x),0)),
type="l",xlab="Tiempo de Supervivencia (Das)",
ylab="Fiabilidad R(t)", cex.lab = 1.2, cex.main=1, cex.axis = 0.75,
col = col,lwd=2)
grid()
legend("right", inset=.05, title ="Parmetros",
labels, lwd=2, lty=1, cex =0.8, col= col, bty="n")
#
# funcin de riesgo o tasa de fallo h(t)=f(t)/R(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
curve((dweibull(x, shape = shape, scale = scale,log=FALSE))/(pweibull(x, shape = shape, scale =
scale,lower=FALSE,log=FALSE)), xlim=c(0,round(max(x),0)),
type="l",xlab="Tiempo de Fallo (Das)",
ylab="Riesgo o Tasa de Fallo h(t)", cex.lab = 1.2, cex.main=1, cex.axis = 0.75,
col = col,lwd=2)
grid()
legend("right", inset=.05, title ="Parmetros",
labels, lwd=2, lty=1, cex =0.8, col= col, bty="n")
#
# funcin de riesgo acumulado H(t)=-log(1-F(t))
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
curve(-pweibull(x, shape = shape, scale = scale,lower=FALSE,log=TRUE),
xlim=c(0,round(max(x),0)),
type="l",xlab="Tiempo de Fallo (Das)",
ylab="Riesgo Acumulado H(t)", cex.lab = 1.2, cex.main=1, cex.axis = 0.75,
col = col,lwd=2)
grid()
legend("right", inset=.05, title ="Parmetros",
labels, lwd=2, lty=1, cex =0.8, col= col, bty="n")
#
#
# 2.3.6.2 clculo de media y varianza
#
shape <- 0.6299
scale <- 39.6759
# Media de tiempo de fallo
med <- scale*gamma(1+(1/shape))
med
# varianza
var <- (scale^2)*(-(gamma(1+(1/shape)^2)) + (gamma(1+(2/shape))))
var
#
#

VI.48
Apndices

4.3. Mantenimiento
#
##########################################################################
# Fiabilidad y Mantenibilidad - Aplicacin practica #
##########################################################################
#
##########################################################################
# Preparacin de los datos #
##########################################################################
#
setwd("E:/11_Master Estadstica/4_Asignaturas/2_Trabajo Fin Master/0_Practica")
#
datos <- read.table("TFM 2014 Datos.txt", header=TRUE, sep="\t", na.strings="NA",
dec=".", strip.white=TRUE)
datos
names(datos)
#
TTF <- datos[,1]
TTR <- datos[,2]
time<-TTR
#
#
##########################################################################
## 3. Anlisis de Mantenibilidad ## #
##########################################################################
#
time
#
##########################################################################
# 3.1 Anlisis exploratorio de datos #
##########################################################################
#
# 3.1.1 Estadsticas bsicas
# Medidas de centralizacin
summary(time)
mode=function(r1){
q=table(r1)
q=sort(q,TRUE)
return(q[1])}
mode(time)
range=function(r2){
range<-max(r2)-min(r2)
out<-list(range=range, min=min(r2),max=max(r2))
return(out)
}
range(time)
quantile (time)
#
# Medidas de dispersin
var (time)
sd(time)

VI.49
Apndices

# Medidas de forma (asimetra, curtosis)


# install.packages("e0711")
library(e1071)
skewness(time, type = 2)
kurtosis(time, type = 2)
#
# 3.1.2 Anlisis grafico
# Diagrama de cajas
boxplot(time, ylab ="Tiempo (Das)", xlab ="Dispositivos", las = 2)
#
# Histograma con distribucin normal
dev.off()
par(mfrow = c(1,1))
h<-hist(time, breaks=15, col="red", xlab="Tiempo de Reparacin (Das)", ylab="Frecuencia",
main="Histograma con Distribucin Normal",xaxt="n", yaxt="n",freq=TRUE)
axis(1, at=seq(0,5,by=.5), labels=seq(00,5,by=.5),cex.axis=.75 )
axis(2, at=seq(0,50,by=10), labels=seq(00,50,by=10),cex.axis=.75 )
xfit<-seq(min(time),max(time),length=50)
yfit<-dnorm(xfit,mean=mean(time),sd=sd(time))
yfit <- yfit*diff(h$mids[1:2])*length(time)
lines(xfit, yfit, col="blue",lwd=2)
#
#
##########################################################################
# 3.2. Anlisis Paramtrico #
##########################################################################
#
##########################################################################
# 3.2.1. Anlisis Grafico #
##########################################################################
#
# Teniendo unas observaciones de una distribucin
# desconocida, se comparan con distribuciones conocidas
# para el ajuste de sus datos
#
# 3.2.1.1. Grficos de grafico de probabilidad o Q-Q
# Ajuste grafico de distribuciones de probabilidad o Q-Q
# instalacin de paquetes
# install.packages("MASS")
# install.packages("car")
library(MASS)
library(car)
library(splines)
library(survival)
library(fitdistrplus)
#
# En la funcin "fitdistr", los parmetros de la distribucin terica univariante
# son fijados libremente, realizndose por mxima verosimilitud.
# La funcin qqPlot () crea un grafico cuantil-cuantil
# para cualquier distribucin terica.
#
par(mfrow = c(3,2))

VI.50
Apndices

norm.fit <- fitdistr(time, "normal")


qqPlot(time, dist = "norm",
mean = norm.fit$estimate["mean"],
sd = norm.fit$estimate["sd"],
main="Q-Q Plot para una Distribucin Normal",
xlab="Quantiles de una Distribucin Normal",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue" )
#
lnorm.fit <- fitdistr(time, "lognormal")
qqPlot(time, dist = "lnorm",
meanlog = lnorm.fit$estimate["meanlog"],
sdlog = lnorm.fit$estimate["sdlog"],
main="Q-Q Plot para una Distribucin Log-Normal",
xlab="Quantiles de una Distribucin Log-Norma",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue")
#
fexp.fit <- fitdistr(time, "exponential")
qqPlot(time, dist = "exp",
rate = fexp.fit$estimate["rate"],
main="Q-Q Plot para una Distribucin Exponential",
xlab="Quantiles de una Distribucin Exponential",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue")
#
fwei.fit <- fitdistr(time, "weibull")
qqPlot(time, dist = "weibull",
shape = fwei.fit$estimate["shape"],
scale = fwei.fit$estimate["scale"],
main="Q-Q Plot para una Distribucin Weibull",
xlab="Quantiles de una Distribucin Weibull",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue")
#
fgam.fit <- fitdistr(time, "gamma")
qqPlot(time, dist = "gamma",
shape = fgam.fit$estimate["shape"],
rate = fgam.fit$estimate["rate"],
main="Q-Q Plot para una Distribucin Gamma",
xlab="Quantiles de una Distribucin Gamma",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue")
#
fpois.fit <- fitdistr(time, "poisson")
qqPlot(time, dist = "pois",
lambda = fpois.fit$estimate["lambda"],
main="Q-Q Plot para una Distribucin Poisson",
xlab="Quantiles de una Distribucin Poisson",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue")
#

VI.51
Apndices

detach ("package:car")
#
par(mfrow = c(1,1))
plot(density(time), main="Distribucin de Densidad"
, ylab="Densidad",lty=1,lwd=2, col ="blue",cex.axis=.75)
grid()
#
#
##########################################################################
# 3.2.1.2. Ajuste analtico Preliminar- Bondad de Ajuste #
# Copyright 2014 worldofpiggy.com (modificada) #
##########################################################################
#
# library(splines)
# library(survival)
# library(fitdistrplus)
# Se usara nuevamente la funcin "fitdistr" para la obtencin
# de los parmetros por mxima verosimilitud y el test de
# Kolmogorov-Smirnov para testear la bondad del ajuste
#
# El parmetro "sample", es el rango de la submuestra (0.5
# significa que el 50% de los datos sern considerados)
#
#Realizacin de funcin para el clculo de parmetros y bondad
# de ajuste K-S
#
fitData <- function(data, fit="gamma", sample=0.5){
distrib = list()
numfit <- length(fit)
results = matrix(0, ncol=6, nrow=numfit)
for(i in 1:numfit){
if((fit[i] == "gamma")|
(fit[i] == "poisson")|
(fit[i] == "weibull")|
(fit[i] == "exponential")|
(fit[i] == "lognormal")|
(fit[i] == "normal")
)
distrib[[i]] = fit[i]
else stop("Suministrar una distribucin valida para el ajuste
de los datos" )
}
# Tomar la muestra del conjunto de datos
n = round(length(data)*sample)
data = sample(data, size=n, replace=F)
for(i in 1:numfit) {
if(distrib[[i]] == "gamma") {
gf_shape = "gamma"
fd_g <- fitdistr(data, "gamma")
est_shape = fd_g$estimate[[1]]
est_rate = fd_g$estimate[[2]]
Log_Likelihood = fd_g$loglik

VI.52
Apndices

ks = ks.test(data, "pgamma", shape=est_shape, rate=est_rate)


# Resultados de test de Bondad de Ajuste
results[i,] = c(gf_shape, round(est_shape,3), round(est_rate,3),
round(Log_Likelihood,3),
round(ks$statistic,3), round(ks$p.value,5))
}
else if(distrib[[i]] == "poisson"){
gf_shape = "poisson"
fd_p <- fitdistr(data, "poisson")
est_lambda = fd_p$estimate[[1]]
Log_Likelihood = fd_p$loglik

ks = ks.test(data, "ppois", lambda=est_lambda)


# Resultados de test de Bondad de Ajuste
results[i,] = c(gf_shape, round(est_lambda,3), "NA",
round(Log_Likelihood,3),
round(ks$statistic,3), round(ks$p.value,5))
}
else if(distrib[[i]] == "weibull"){
gf_shape = "weibull"
fd_w <- fitdistr(data, "weibull")
est_shape = fd_w$estimate[[1]]
est_scale = fd_w$estimate[[2]]
Log_Likelihood = fd_w$loglik

ks = ks.test(data, "pweibull", shape=est_shape, scale=est_scale)


# Resultados de test de Bondad de Ajuste
results[i,] = c(gf_shape, round(est_shape,3), round(est_scale,3),
round(Log_Likelihood,3),
round(ks$statistic,3), round(ks$p.value,5))
}
else if(distrib[[i]] == "normal"){
gf_shape = "normal"
fd_n <- fitdistr(data, "normal")
est_mean = fd_n$estimate[[1]]
est_sd = fd_n$estimate[[2]]
Log_Likelihood = fd_n$loglik

ks = ks.test(data, "pnorm", mean=est_mean, sd=est_sd)


# Resultados de test de Bondad de Ajuste
results[i,] = c(gf_shape, round(est_mean,3), round(est_sd,3),
round(Log_Likelihood,3),
round(ks$statistic,3), round(ks$p.value,5))
}
else if(distrib[[i]] == "exponential"){
gf_shape = "exponential"
fd_e <- fitdistr(data, "exponential")
est_rate = fd_e$estimate[[1]]
Log_Likelihood = fd_e$loglik

ks = ks.test(data, "pexp", rate=est_rate)

VI.53
Apndices

# Resultados de test de Bondad de Ajuste


results[i,] = c(gf_shape, round(est_rate,3), "NA",
round(Log_Likelihood,3),
round(ks$statistic,3), round(ks$p.value,5))
}
else if(distrib[[i]] == "lognormal"){
gf_shape = "lognormal"
fd_ln <- fitdistr(data, "lognormal")
est_mean = fd_ln$estimate[[1]]
est_sd = fd_ln$estimate[[2]]
Log_Likelihood = fd_ln$loglik

ks = ks.test(data, "plnorm", mean=est_mean, sd=est_sd)


# Resultados de test de Bondad de Ajuste
results[i,] = c(gf_shape, round(est_mean,3), round(est_sd,3),
round(Log_Likelihood,3),
round(ks$statistic,3), round(ks$p.value,5))
}
}
results = rbind(c("distribucin", "param1", "param2", "Log_Likelihood",
"ks stat", "ks pvalue"), results)
#print(results)
return(results)
}
# Comparacion de datos con diversas distribuciones, Obteniendo K-S Stat
Aj <- fitData(time, fit=c("lognormal", "normal", "exponential",
"weibull", "gamma", "poisson"), sample=1)
#
colnames(Aj) = Aj[1, ] # la primera fila ser la cabecera
Aj = Aj[-1, ] # eliminar primera fila.
Aj1<-Aj[order(Aj[, 5]),]
Aj1
Aj2<-Aj[order(Aj[, 4]),]
Aj2
#
#
##########################################################################
# 3.2.1.3. Estimacin Grafica Paramtrica #
##########################################################################
#
# Se realizara la estimacin grafica de los parmetros de la distribucin
# Weibull, se comprobara el ajuste por el mtodo de regresin lineal
# mnimo-cuadrtica y analizara grficamente el ajuste
#
## Proceso de estimacin paramtrica
# Ordenar datos de tiempo
timeSort <- sort(time)
# calcular el nmero de datos
n <- length(time)
# Calcular el RANGO DE MEDIANA.
i <- 1:n
RM <- 1- ((i-0.3)/(n+0.4)) # Rango de Mediana .

VI.54
Apndices

# Valores de (x, y) para el grfico.


Y <- function(d) {y <- qnorm(d,mean = 0, sd = 1,lower.tail = T, log.p = F); y}
X <- -log(timeSort)
# Crear tabla de datos.
tabla1 <- data.frame(i,timeSort, RM, X, Y(RM))
# Ajustar recta de regresin, limites de confianza y parmetros
lm1 <- lm(Y(RM)~X, data=tabla1)
# Estimacin Parmetros
sdlog <- round (1/coef(lm1)[2], 4)
interc <- round (coef(lm1)[1], 4)
mlog <- round ((interc*sdlog), 4)
R2 <- round (summary(lm1)$r.squared, 4)
r <- round (cor(X, Y(RM)), 4)
# Grfica de recta de regresin para clculo de parmetros grficamente
library(car)
par(mfrow = c(1,1))
scatterplot(tabla1$X,tabla1$Y.RM., reg.line=F,
smooth=F, spread=T, boxplots=F,
xaxp=c(-1.5, 5, 10),yaxp=c(-2.5, 2.5, 10),
span=0.5, axes=T, lwd=1.8, cex=1, cex.lab =.9 ,cex.axis =.75,
xlim=c(-1.5,5), ylim=c(-2.5,2.5),
main=" Grfica de Lognormal ",
xlab = "Tiempo de Reparacin (-log(t))",
ylab="Funcin de Supervivencia Linealizada",
col="red", pch=21,reset.par=F)
#
abline(lm1,col="red", lty =1, lwd=2) ## recta de regresin
# corte con la recta
abline (h=0 , col="blue" ,lty =2, lwd=2) # ajuste manual y=0 en escala ln ln
abline (v=1.42 , col="blue" ,lty =2, lwd=2) # ajuste manual
# Lneas para clculo de la tg de alfa y la sdlog
abline (h=2.37 , col="green" ,lty =2, lwd=2) # ajuste manual
abline (v=4.82, col="green" ,lty =2, lwd=2) # ajuste manual
# Lneas para clculo de meanlog
abline (v=0, col="darkmagenta" ,lty =2, lwd=2) # ajuste manual x=0
abline (h=-1 , col="darkmagenta" ,lty =2, lwd=2) # ajuste manual
# tg alfa=y/x=2.37/(4.82-1.42)=0.6451,
# sdlog = 1/tg alfa = 1/0.6451 = 1.4346
# meanlog = 1.4346 *(-1) = -1.4346
#
# Ajuste grafico a una distribucin por mxima verosimilitud
# Dentro del paquete fitdistrplus se encuentra la funcin plotdist,
# se podr graficar cualquier distribucin paramtrica indicando
# los valores de los parmetros especficos por medio de mxima verosimilitud
fmle <- fitdist(time, "lnorm", method="mle")
plot(fmle)
#
# Evaluacin de residuos
layout(matrix(1:4,2,2))
plot(lm1)
Lognormal
#

VI.55
Apndices

#
##########################################################################
# 3.2.2 Estimacin Paramtrica puntual #
##########################################################################
#
##########################################################################
# 3.2.2.1. Estimacin Paramtrica puntual por Mnimos Cuadrados #
##########################################################################
#
# La estimacin fue realizada por razones prcticas en el apartado 3.2.1.3.
# Estimacin Grafica Paramtrica, reproduciremos en esta seccin
# la impresin de los parmetros
#
lm1
flsm <- c(sdlog, mlog)
rlsm <- rbind(c("Desv. Estand", "Media"),flsm)
colnames(rlsm) <- rlsm[1, ] # la primera fila ser la cabecera
rlsm <- rlsm[-1, ] # eliminar primera fila.
rlsm
#
#
##########################################################################
# 3.2.2.2. Estimacin Paramtrica puntual por Mxima Verosimilitud #
##########################################################################
#
# 3.2.2.2.1. clculo de las estimaciones para observaciones completas
# El paquete fitdistrplus permitir el clculo de los parmetros
# de la distribucin.
# library (fitdistrplus)
fmle <- fitdist(time, "lnorm", method="mle")
fmle
#
#
# 3.2.2.2.2. clculo de las estimaciones para observaciones con censura
# El paquete STAR permitir calcular mediante la funcin lnormMLE
# las estimaciones por el mtodo de mxima verosimilitud de los parmetros
# de la distribucin Lognormal y permitir hacer estas estimaciones tanto
# para muestras completas como para muestras con censura tipo II.
# install.packages("STAR")
library(STAR)
# En el caso de muestras completas se definir "si" como
# numeric(length(yi))+1, que es el valor por defecto, pero en el
# caso de muestras censuradas tipo II, se reordenara la muestra con
# el comando sort y se definir "si" como c(rep(1,r),rep(0,n-r)),
# por lo que se tendr una muestra ordenada con r datos no censurados
# y n-r datos censurados.
wmle<-suppressWarnings(lnormMLE(time, si=numeric(length(time))+1))
wmle$estimate
#
##########################################################################
# 3.2.2.3. Estimacin Paramtrica puntual por Momentos #
##########################################################################

VI.56
Apndices

#
# Mediante la funcin pelwei del paquete lmon es posible el clculos de los
# parmetros de la distribucin mediante el mtodo de momentos. Con la
# indicacin de bound=000, el clculo se realiza forzando el parmetro de
# localizacin a 0.
# install.packages("lmom")
library(lmom)
lmom <- samlmu(time, nmom=2)
# Para una distribucin Lognormal
pelln3(lmom ,bound=000)
#
#
##########################################################################
# 3.2.3 Estimacin Paramtrica por Intervalos #
##########################################################################
#
##########################################################################
# 3.2.3.1. Estimacin Paramtrica para Intervalos por Mnimos Cuadrados #
##########################################################################
#
# la estimacin por intervalos proporciona un intervalo dentro del cual hay
# una alta probabilidad (nivel de confianza) de que est contenido
# el verdadero valor del parmetro.
# library(car)
# el parmetro de forma y escala (scale) tendrn los siguientes valores para
# unos intervalos de confianza al 95%
ic<-confint(lm1, level=0.95)
ic
sd_lm_U<-round (1/ic[2,1], 4)
sd_lm_L<-round (1/ic[2,2], 4)
m_lm_L <- round ((ic[1,1]*sdlog), 4)
m_lm_U <- round ((ic[1,2]*sdlog), 4)
lsmi <- cbind(sdlog, sd_lm_L, sd_lm_U,mlog, m_lm_L, m_lm_U)
rlsmi <- rbind(c("sdlog","sdlog_2.5%", "sdlog_97.5%", "mlog", "mlog_2.5%", "mlog_97.5%"),lsmi)
colnames(rlsmi) <- rlsmi[1, ] # la primera fila ser la cabecera
rlsmi <- rlsmi[-1, ] # eliminar primera fila.
rlsmi
#
# Grafica para intervalos
#
# Intervalos de Confianza y Prediccin con valores originales de X
# (tiempos ordenados)
# X <- log(timeSort)
# lm1 <- lm(Y(RM)~X, data=tabla1)
p_conf1 <- predict(lm1,interval="confidence", level = 0.95)
p_pred1 <- predict(lm1,interval="prediction", level = 0.95)
tabod<-data.frame(X,p_conf1,p_pred1) # Intervalos con valores originales
#
# Intervalos de Conf. y Pred, con nuevos valores de X (extrapolados
# y ms finamente/uniformemente espaciados que los datos originales )
nd <- data.frame(X = seq(0, 4))
p_conf2 <- predict(lm1,interval="confidence",newdata=nd)

VI.57
Apndices

p_pred2 <- predict(lm1,interval="prediction",newdata=nd)


tabnd<-data.frame(nd,p_conf2,p_pred2)# Intervalos con nuevos valores
#
# Grfica de recta de regresin con limites
library(car)
par(mfrow = c(1,1))
scatterplot(tabla1$X,tabla1$Y.RM., reg.line=F,
smooth=F, spread=F, boxplots="xy",
xaxp=c(-1.5, 5, 10),yaxp=c(-2.5, 2.5, 10),
span=.5, axes=T, lwd=1.8, cex=1, cex.lab =1 ,cex.axis = .9,
xlim=c(-1.5,5), ylim=c(-2.5,2.5),
main=" Grfica de Lognormal ",
xlab = "Tiempo de Reparacin (-log(t))",
ylab="Funcin de Supervivencia Linealizada",
col="red", pch=21,reset.par=F)
abline(lm1, col="black", lty =1, lwd=1.8) ## recta de regresin) ## recta de regresin
#
matlines(tabod$X,tabod[,c("lwr","upr")],col="red",lty=1,lwd=1.8, type="l",pch="+")
matlines(tabod$X,tabod[,c("lwr.1","upr.1")],col="red",lty=2,lwd=1.8, type="l",pch=1)
#
matlines(tabnd$X,tabnd[,c("lwr","upr")],col="blue",lty=1,lwd=1.8, type="l",pch="+")
matlines(tabnd$X,tabnd[,c("lwr.1","upr.1")],col="blue",lty=2,lwd=1.8, type="l",pch=1)
#
legend(2,-1,
legend=c(expression(paste("Interv. Conf./Pred. val. orig. de t")),
expression(paste("Interv. Conf./Pred. val. nuevos de t"))),
col=c("red", "blue"),cex = 0.7,
lwd=1.8,lty=c(2,2),bty="n")
#
#
##########################################################################
# 3.2.3.2. Estimacin Par. para Intervalos por Mxima Verosimilitud #
##########################################################################
#
# Obtencin de los intervalos de confianza basados en el test de
# razn de verosimilitudes para los parmetros de la distribucin
# del conjunto de datos.
#
# Dentro del Paquete Sim.DiffProc se encuentra la funcin AjdLognormal,
# que proporcionar intervalos de confianza para el modelo Lognormal,
# cuando se trabaje con muestras de datos no censuradas
#
# install.packages("Sim.DiffProc_2.5.zip",repos=NULL)
# remove.packages(Sim.DiffProc,lib)
# install.packages("scatterplot3d")
library(scatterplot3d)
library(rgl)
library(Sim.DiffProc)
#
imle<-Ajdlognorm(time,starts=list(meanlog = .01, sdlog = .01),leve=0.95)
imle<-cbind(round(imle$coef,4),round(imle$confint,4))
imle

VI.58
Apndices

#
#
##########################################################################
# 3.2.4 Comparativa de Mtodos de clculo #
##########################################################################
#
cpar<-function(time, mlog=1, sdlog=1 ){
timeSort <- sort(time)
n <- length(time)
i <- 1:n
RM1 <- (i-0.3)/(n+0.4) # Rango de Mediana .
Frm <- RM1
Fhrm <- qnorm(((log(timeSort)-mlog)/sdlog),mean = 0, sd = 1,lower.tail = T, log.p = F)
Fi<-(Fhrm-Frm)^2
Fi<-data.frame(Fi)
Fi<- Fi[complete.cases(Fi), ]
MSE<-sum(Fi,na.rm=TRUE)
tabla2 <- cbind(i,timeSort,Frm,Fhrm,Fi)
MSE = cbind(MSE)
print(tabla2)
print(MSE)
}
cpar(time, mlog= -1.42255 , sdlog= 1.37678 )
#
#
##########################################################################
# 3.2.5. Test de Bondad de ajuste a una distribucin #
##########################################################################
#
##########################################################################
# 3.2.5.1. Test de Bondad para estimacin por Mnimos Cuadrados #
##########################################################################
#
# Evaluacion de resultado de la regresin
summary(lm1)
# Anlisis de varianza del modelo de regresin lineal
# Estudio de la relacin lineal entre ambas variables
anova(lm1)
# Test de independencia lineal y correlacin lineal r
cor.test(tabla1$X, tabla1$Y.RM., alternative="two.sided", method="pearson")
#
#
##########################################################################
# 3.2.5.2. Test de la Bondad mediante estadsticos #
##########################################################################
#
# 3.2.5.2.1. Aplicacin Conjunta de diversos Test
# Mediante la funcin gofstat del paquete fitdistrplus se realiza
# la estimacin de la bondad de ajuste para distribuciones continuas mediante
# los estadsticos de Cramer-von Mises, Kolmogorov-Smirnov y Anderson-Darling.
#
# Para conjunto de observaciones de n > 5 y distribuciones continuas,

VI.59
Apndices

# los test de Cramer-von Mises y Anderson-Darling se realizan sin conocimiento


# de los parmetros de la distribucin. El resultado ser la decisin de rechazar
# o no la distribucin terica con un nivel de significancia de 0.05.
# Ambos test se realizan por mxima verosimilitud
#
# Cuando se ajustan distribuciones discretas el estadstico chi-cuadrado es
# utilizado con la misma funcin pero con el argumento chisqbreaks o meancount.
#
testData <- function(x, y="lnorm", meanlog=meanlog, sdlog=sdlog ){
n<-length(x)
if (n <= 30) {
# test de K-S.
tmle <- suppressWarnings(fitdist(xe, "lnorm", method="mle"))
st <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=FALSE)
library(Sim.DiffProc)
ks<-suppressWarnings(test_ks_dlognorm(x, meanlog, sdlog))
if (ks[2] > 0.05) {
res <- data.frame(n, meanlog, sdlog, st$cvm, st$cvmtest, st$ad, st$adtest,
st$ks, st$kstest, row.names = "Resultados")
print(res)
writeLines("\n Se ACEPTA la hiptesis nula p-valor > 0.05 (nivel de significancia).
Los datos siguen una distribucin de Lognormal segn test Kolmogorov Smirnov.")
} else {
res <- data.frame(n, meanlog, sdlog, st$cvm, st$cvmtest, st$ad, st$adtest,
st$ks, st$kstest, row.names = "Resultados")
print(res)
writeLines("\n Se RECHAZA la hiptesis nula p-valor < 0.05 (nivel de significancia).
Los datos NO siguen una distribucin de Lognormal segn test Kolmogorov Smirnov.")
}
} else {
# test de Chi-cuadrado
tmle <- suppressWarnings(fitdist(x, "lnorm", method="mle"))
chi <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=FALSE)
if (chi$chisqpvalue > 0.05) {
res <- data.frame( n, meanlog, sdlog, chi$chisqpvalue,
row.names = "Resultados")
print(res)
writeLines("\n Se ACEPTA la hiptesis nula p-valor > 0.05 (nivel de significancia).
Los datos siguen una distribucin de Lognormal segn test Chi-cuadrado.")
} else {
res <- data.frame(n, meanlog, sdlog, chi$chisqpvalue,
row.names = "Resultados" )
print(res)
writeLines("\n Se RECHAZA la hiptesis nula p-valor < 0.05 (nivel de significancia).
Los datos NO siguen una distribucin de Lognormal segn test Chi-cuadrado.")
}
}
}
#
meanlog <- -1.38153
sdlog <- 1.28233
testData(time,y= "plnorm", meanlog=meanlog, sdlog=sdlog)

VI.60
Apndices

#
#
# 3.2.5.2.2. Test Individual de Kolmogorov Smirnov
# Mediante la funcin test_ks_dLognormal del paquete Sim.DiffProc se
# realiza el test de bondad de ajuste de Kolmogorov Smirnov para contrastar si
# un conjunto de datos sigue o no un modelo de distribucin Lognormal.
library(Sim.DiffProc)
ks <-test_ks_dlognorm(time, meanlog=meanlog, sdlog=sdlog)
res <- data.frame(n, meanlog, sdlog, ks[1], ks[2],
row.names = "Resultados" )
res
#
# EL valor del estadstico obtenido de Ks es de 0.1130335 que si se comparara con el
# establecido en la tabla para un nivel de significacin de 5% y una muestra
# de 80 (ir a tabla K-S) D(0.05,80)=1.36/(raiz2(80))= 0.1521.
# Dado que el estadstico (0,0792) es menor que el valor de la tabla(0,1521),
# no se puede rechazar la hiptesis de que las observaciones no sigan
# la distribucin terica.
#
# Donde si el p-valor es mayor que el nivel de significancia de 0.05
# Se puede afirmar que el conjunto de datos sigue una distribucin Lognormal
#
#
##########################################################################
# 3.2.6 Propiedades de Fiabilidad para Distribucin Lognormal #
##########################################################################
#
# 3.2.6.1 Graficas de la distribucin de Lognormal
x <- time
meanlog <- -1.38153
sdlog <- 1.28233
col <- "blue"
labels <-c(expression(paste(, mu, " = -1.38153, ", sigma," = 1.28233 ")))
#
# funcin de densidad f(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
curve(dlnorm(x, meanlog=meanlog, sdlog=sdlog,log=FALSE), xlim=c(0,round(max(x),0)),
type="l",xlab="Tiempo de Reparacin (Das)",
ylab="Densidad f(t)", cex.lab = 1, cex.main=1, cex.axis = 0.75,
col = col,lwd=2)
grid()
legend("right", inset=.05, title ="Parmetros",
labels, lwd=2, lty=1, cex =0.8, col= col, bty="n")
#
# funcin de Mantenibilidad M(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
curve(plnorm(x, meanlog=meanlog, sdlog=sdlog,lower=TRUE,log=FALSE),
xlim=c(0,round(max(x),0)),
type="l",xlab="Tiempo de Reparacin (Das)",
ylab="Mantenibilidad M(t)", cex.lab = 1, cex.main=1, cex.axis = 0.75,
col = col,lwd=2)
grid()

VI.61
Apndices

legend("right", inset=.05, title ="Parmetros",


labels, lwd=2, lty=1, cex =0.8, col= col, bty="n")
#
# funcin no reparabilidad R(t)=1-F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
curve(plnorm(x, meanlog=meanlog, sdlog=sdlog,lower=FALSE,log=FALSE),
xlim=c(0,round(max(x),0)),
type="l",xlab="Tiempo de Reparacin (Das)",
ylab="no Reparabilidad R(t)", cex.lab = 1, cex.main=1, cex.axis = 0.75,
col = col,lwd=2)
grid()
legend("right", inset=.05, title ="Parmetros",
labels, lwd=2, lty=1, cex =0.8, col= col, bty="n")
#
# Tasa de Reparacin h(t)=f(t)/R(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
curve((dlnorm(x, meanlog=meanlog, sdlog=sdlog,log=FALSE))/(plnorm(x, meanlog=meanlog,
sdlog=sdlog,lower=FALSE,log=FALSE)),
xlim=c(0,round(max(x),0)+6),
# xlim=c(0,round(max(x),0)),
type="l",xlab="Tiempo de Reparacin (Das)",
ylab="Tasa de Reparacin h(t)", cex.lab = 1, cex.main=1, cex.axis = 0.75,
col = col,lwd=2)
grid()
legend("right", inset=.05, title ="Parmetros",
labels, lwd=2, lty=1, cex =0.8, col= col, bty="n")
#
# Tasa de Reparacin Acumulada H(t)=-log(1-F(t))
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
curve(-plnorm(x, meanlog=meanlog, sdlog=sdlog,lower=FALSE,log=TRUE),
xlim=c(0,round(max(x),0)),
type="l",xlab="Tiempo de Reparacin (Das)",
ylab="Tasa de Reparacin Acumulada H(t)", cex.lab = 1, cex.main=1, cex.axis = 0.75,
col = col,lwd=2)
grid()
legend("right", inset=.05, title ="Parmetros",
labels, lwd=2, lty=1, cex =0.8, col= col, bty="n")
#
#
# 3.2.6.2 clculo de media y varianza
#
meanlog <- -1.38153
sdlog <- 1.28233
# Media de Tiempo de Reparacin
med <- exp(meanlog+((sdlog^2)/2))
med
# varianza
var <- (exp((2*meanlog)+(sdlog^2)))*(-1+exp(sdlog^2))
var
#
#

VI.62
Apndices

#
##########################################################################
# 3.3. Anlisis no Paramtrico #
##########################################################################
#
# cargar la librera Survival
# install.packages("survival")
library("splines")
library("survival")
#
# la funcin Surv crea un objeto de supervivencia o no reparabilidad en el cual se captura
# el tiempo observado de la variable y su estado (censurado o no)
# Presenta los argumentos time y event. El argumento time corresponde
# al tiempo desde que el sujeto entra al estudio, hasta que este presenta
# la reparacin o censura. El argumento event es una variable binaria que indica
# el estatus del tiempo registrado, donde, de forma predeterminada corresponde a
# 0 <- si el dato es censurado
# 1 <- si la falla es observada
#
# Debido que no se tiene informacin de datos censurados, se asumir un estudio
# con datos completos. Los dispositivos han fallado en el tiempo de control y,
# por tanto, su estado se representara por 1 en todos ellos.
event<-c(rep(1,80))
event
db<-data.frame(cbind(time, event))
db
#
##########################################################################
# 3.3.1. Estimacin de la funcin de supervivencia o no reparabilidad #
##########################################################################
#
# 3.3.1.1. Estimador de Kaplan-Meier
# La informacin del estimador de Kaplan-Meier para la funcin de supervivencia
# indica la probabilidad en cada tiempo t de que el sistema no est
# an reparado. Esta funcin es obtenida de la siguiente forma
survfit(Surv(db$time, db$event)~ 1,type="kaplan-meier",
conf.type="none")
#
# Informacin adicional con la funcin summary
KM <- survfit(Surv(db$time, db$event)~ 1,type="kaplan-meier",
conf.type="none")
summary(KM)
#
# Obtener la informacin dada por summary en tiempos especficos,
time1 <- c(0,.1,.2,.5,1,2,3)
summary(KM,time1)
#
# Atributos del objeto survfit
names(KM)
#
# Obtener los tiempos de reparacin
summary(KM)$time

VI.63
Apndices

#
# Obtener los datos de supervivencia o no reparabilidad de los tiempos de reparacin
summary(KM)$surv
#
# 3.3.1.2. Grafica de la funcin de supervivencia o no reparabilidad
# Se usa el argumento conf.int = F debido a que no se desea que muestre
# el intervalo de confianza estimado para la funcin de supervivencia
plot(KM,conf.int=F, main = "Funcin de no Reparabilidad",
xlab= "Tiempo de Reparacin (Das)",ylab="Probabilidad de no Reparabilidad",lwd=2,
col ="blue",xaxt="n", yaxt="n")
box(lwd=1.8, col = 'black')
axis(1, at=seq(0,5,by=.5), labels=seq(00,5,by=.5),cex.axis=.75 )
axis(2, at=seq(0,1,by=.1), labels=seq(0,1,by=.1),cex.axis=.75 )
abline(h = seq(0,1,.1), v = seq(0,5,.5),lty=3,lwd=1,
col ="gray")
legend(2,0.6,c("Funcin de no Reparabilidad"),lwd=2,lty=1,
col="blue", cex =.75, bty="n")
#
#
# 3.3.1.3. Intervalo de confianza para la funcin de no Reparabilidad
# Se realiza con el argumento conf.type dentro de la funcin survfit
## La funcin de no Reparabilidad estimada por medio del estimador de
# Kaplan-Meier y su intervalo de confianza
KM.ord <- survfit(Surv(db$time, db$event)~ 1,type="kaplan-meier",
, error="greenwood", conf.type="plain",conf.int=0.95)
KM.ord
# Informacin adicional
summary(KM.ord, conf.type = "plain")
#
# Intervalo de confianza con la funcin de no Reparabilidad estimada
plot(KM.ord, main = "Funcin de no Reparabilidad", xlab= "Tiempo de Reparacin (Das)",
ylab="Probabilidad de no Reparabilidad", col=c("blue", "darkmagenta", "darkmagenta"),
lwd=1.8,
lty=c(1,3,3), cex =0.9,cex.axis=.75)
mtext("Mtodo de Kaplan-Meier - IC de 95%", side=3, cex=1)
grid()
legend(2,.6,
legend=c(expression(paste("Funcin de no Reparabilidad")),
expression(paste("Intervalo de Confianza"))),
col=c("blue", "darkmagenta", "darkmagenta"),cex = 0.75,
lwd=1.8,lty=c(1,3,3),bty="n")
#
#
# 3.3.1.4. Comparativa de Estimacin de la funcin de no Reparabilidad
#
# a.- clculo del estimador Nelson-Aalen mediante regresin de cox,
# usando la funcin coxph
aa<- survfit(coxph(Surv(db$time, db$event)~1), type="aalen")
summary(aa)
h.aalen<-(-log(aa$surv))
aalen.est<-cbind(time=aa$time, d=aa$n.event, n=aa$n.risk,
h.aalen, s1=aa$surv)

VI.64
Apndices

#
# b.- clculo del estimador kaplan-meier mediante survival
b<-survfit(Surv(db$time, db$event)~1, type="kaplan-meier")
km.est<-cbind(time=b$time, s2=b$surv)
#
# Generacin de base de datos conjunta
all<-merge(data.frame(aalen.est), data.frame(km.est), by="time")
all
#
# Grafica de comparacin
plot(all$time, all$s1, xlab="Tiempo de Reparacin (Das)",
ylab="Probabilidad de no Reparabilidad",
main="Comparativa de Estimacin de Funcin de no Reparabilidad",
type="s",cex.axis=.75)
points(all$time, all$s1, pch=1)
lines(all$time, all$s2, type="s")
points(all$time, all$s2, pch=3)
legend(2, .6, c("Nelson-Aalen", "Kaplan-Meier"), pch=c(1, 3),cex =0.75, bty="n")
grid()
#
#
##########################################################################
# 3.3.2.Funcion de Mantenibilidad #
##########################################################################
#
# analoga a la funcin de distribucin acumulada,
# la funcin seria M(t)=1-S(t) o fun="event"
#
plot(KM.ord,fun = function(x) 1-x, main = "Funcin de Mantenibilidad", xlab= "Tiempo de
Reparacin (Das)",
ylab="Mantenibilidad Acumulada", col=c("blue", "darkmagenta", "darkmagenta"), lwd=1.8,
lty=c(1,3,3), cex =0.9,cex.axis=.75)
mtext("Mtodo de Kaplan-Meier - IC de 95%", side=3, cex=1)
grid()
legend(2,.6,
legend=c(expression(paste("Funcin de Mantenibilidad")),
expression(paste("Intervalo de Confianza"))),
col=c("blue", "darkmagenta", "darkmagenta"),cex = 0.75,
lwd=1.8,lty=c(1,3,3),bty="n")
#
#
##########################################################################
# 3.3.3. Funcin de Tasa de Reparacin Acumulada #
##########################################################################
#
# se utiliza como argumento de la funcin plot, fun = "cumhaz "
# Se usa el argumento conf.int = T debido a que se desea que muestre
# el intervalo de confianza estimado
KM1 <- survfit(Surv(db$time, db$event) ~ 1, type="kaplan-meier",
conf.type="log",conf.int=0.95)
plot(KM1, lty=c(1,3,3), fun="cumhaz", conf.int=T,
main = "Funcin de Tasa de Reparacin Acumulada con Intervalos ",

VI.65
Apndices

xlab="Tiempo de Reparacin (Das)", ylab="Tasa de Reparacin Acumulada",lwd=1.7,


col="blue", cex =0.9,cex.axis=.75)
mtext("Mtodo de Kaplan-Meier - IC de 95%", side=3, cex=1)
grid()
legend(2,.6,
legend=c(expression(paste("Funcin de Tasa de Reparacin Acumulada")),
expression(paste("Intervalo de Confianza"))),
col=c("blue", "blue", "blue"),cex = 0.7,
lwd=1.8,lty=c(1,3,3), bty="n")
#
#
## Comparativa de la Estimacin de la Funcin de Tasa de Reparacin Acumulada
# La funcin de Tasa de Reparacin Acumulada y la funcin
# de no Reparabilidad estn relacionadas para datos continuos
# de la siguiente forma S(t) = exp {-H(t)}.
# Esto ofrece un mtodo de estimacin inmediata de h(t)
# haciendo logaritmos a ambos lados H(t) = -logS(t).
# Un segundo mtodo de estimacin de H(t) es usando el estimador
# de Nelson-Aalen y su varianza
#
# Opcin 1: Mediante -log S(t)(H.hat)
# No hay una funcin directa que realice el clculo en el paquete
# "survival", pero si puede ser realizado usando la salida de survfit():
H.fit <- summary(survfit(Surv(db$time, db$event) ~ 1))
#
# Funcin para evitar errores con datos
ldata <- function(v,MAX,MIN){pmin(MAX,pmax(MIN,v))}
H.fit$surv<-ldata(H.fit$surv,MAX=10,MIN=0.0001)
H.hat <- -log(H.fit$surv)
H.hat
H.hat <- c(H.hat, H.hat[length(H.hat)])
#
# Opcin 2: Mediante el estimador Nelson-Aalen (H.tilde)
h.sort.of <- H.fit$n.event / H.fit$n.risk
H.tilde <- vector()
for(i in 1:length(h.sort.of)) H.tilde[i] <- sum(h.sort.of[1:i])
H.tilde <- c(H.tilde, H.tilde[length(H.tilde)])
#
# Grafica de ambas opciones
yl<-range(ldata(c(H.hat, H.tilde),MAX=10,MIN=0.0001))
plot(c(H.fit$time, 5), H.hat, xlab="Tiempo de Reparacin (Das)", ylab="Tasa de Reparacin
Acumulada",
main="Comparativa de Estimacin de Tasa de Reparacin Acumulada", ylim=c(yl[1],yl[2]),
cex.axis=.75,col="blue",lwd=2, type="s")
points(c(H.fit$time, 5), H.tilde, lty=2, ylim=c(yl[1],yl[2]),type="s")
legend(1,7, legend=c("-logR(t)","Nelson-Aalen"), lty=1:2, col="blue",lwd=2,
cex =0.9, bty="n")
#
#
##########################################################################
# 3.3.4. Ajuste de datos tiempo-evento (no Rep) a modelos paramtricos #
##########################################################################

VI.66
Apndices

#
# Dentro del paquete flexsurv, esta la funcin flexsurvreg que crea
# modelos paramtricos para datos de tiempo hasta el suceso
# (no Reparabilidad). Los datos pueden ser censurados por la derecha o
# truncados a la izquierda. Diferentes distribuciones paramtricas
# estn disponibles.
#
# install.packages("flexsurv")
library(muhaz)
library(flexsurv)
#
sLno <- flexsurvreg(Surv(db$time, db$event)~1,dist='lnorm')
sexp <- flexsurvreg(Surv(db$time, db$event)~1,dist="exp")
sWei <- flexsurvreg(Surv(db$time, db$event)~1,dist='weibull')
sgano <- flexsurvreg(Surv(db$time, db$event)~1,dist='gamma')
#
# 3.3.4.1. Funcin de no Reparabilidad (Mantenibilidad)
plot(sWei, type="survival", col.obs="black",
lty.obs=1,lwd.obs=1.9, col="red",
lwd=2, lty=1, cex.axis=.75)
title(main="Funcin de no Reparabilidad", col.main="navy",
xlab="Tiempo de Reparacin (Das)", ylab="Probabilidad de no Reparabilidad",
col.lab="navy", cex.lab=0.9)

lines(sLno,type="survival", ci=NULL, col="navy", lwd=2, lty=1)


lines(sexp, type="survival", ci=NULL, col="cyan", lwd=2, lty=1)
lines(sgano, type="survival", ci=NULL, col="green",lwd=2, lty=1)
grid()
legend(2,.6,
legend=c(expression(paste("Funcin de no Reparabilidad")),
expression(paste("Ajuste F. no Rep. Weibull")),
expression(paste("Ajuste F. no Rep. LogNormal")),
expression(paste("Ajuste F. no Rep. Exponencial")),
expression(paste("Ajuste F. no Rep. Gamma"))),
col=c("black", "red", "navy", "cyan", "green"), cex = 0.7,
lwd=2, lty=1, bty="n")
#
#
# 3.3.4.2. Funcin de Tasa de Reparacin
## La funcin muhaz estima la funcin de Tasa de Reparacin para datos censurados
# a la derecha usando mtodos basados en kernel
#
ha1<-muhaz(db$time, db$event, min.time=0.0001, max.time=3.86)
plot(ha1, type="s", lty=1,lwd=1.8,xlab="", ylab="",
col="black",cex.axis=.75, xlim=c(0,4), ylim=c(0,4))
title(main="Funcin de Tasa de Reparacin", col.main="navy",
xlab="Tiempo de Reparacin (Das)", ylab="Tasa de Reparacin h(t)",
col.lab="navy", cex.lab=0.9)

lines(sWei,type="hazard", ci=NULL, col="red", lwd=2, lty=1)


lines(sLno,type="hazard", ci=NULL, col="navy", lwd=2, lty=1)
lines(sexp, type="hazard", ci=NULL, col="cyan", lwd=2, lty=1)

VI.67
Apndices

lines(sgano, type="hazard", ci=NULL, col="green",lwd=2, lty=1)


grid()
legend(2,3.5,
legend=c(expression(paste("Funcin de Tasa de Reparacin")),
expression(paste("Ajuste T. Rep. Weibull")),
expression(paste("Ajuste T. Rep. LogNormal")),
expression(paste("Ajuste T. Rep. Exponencial")),
expression(paste("Ajuste T. Rep. Gamma"))),
col=c("black", "red", "navy", "cyan", "green"), cex = 0.7,
lwd=2, lty=1, bty="n")
#
#
# 3.3.4.3. Funcin de Tasa de Reparacin Acumulada
plot(sWei, type="cumhaz", col.obs="black",
lty.obs=1,lwd.obs=1.9, col="red",
lwd=2, lty=1, cex.axis=.75)
title(main="Funcin de Tasa de Reparacin Acumulada", col.main="navy",
xlab="Tiempo de Reparacin (Das)", ylab="Tasa de Reparacin Acum..H(t)",
col.lab="navy", cex.lab=0.9)

lines(sLno,type="cumhaz", ci=NULL, col="navy", lwd=2, lty=1)


lines(sexp, type="cumhaz", ci=NULL, col="cyan", lwd=2, lty=1)
lines(sgano, type="cumhaz", ci=NULL, col="green",lwd=2, lty=1)
grid()
legend(2,1.5,
legend=c(expression(paste("Funcin de Tasa de Reparacin Acumulada")),
expression(paste("Ajuste T. Rep. Acum. Weibull")),
expression(paste("Ajuste T. Rep. Acum.. LogNormal")),
expression(paste("Ajuste T. Rep. Acum. Exponencial")),
expression(paste("Ajuste T. Rep. Acum. Gamma"))),
col=c("black", "red", "navy", "cyan", "green"), cex = 0.7,
lwd=1.8, lty=1, bty="n")
#
#
##########################################################################
# 3.3.5. Parametrizacion No Paramtrica #
##########################################################################
#
# Ajuste a un modelo de regresin de no Reparabilidad paramtrica
## Parametrizacin lognormal
#
# Hay mltiples maneras de paramtrica una distribucin lognormal.
# La funcin survreg lo realiza en una familia general de medi-desv.est.
# que es una parametrizacin diferente a la funcin de rlnorm
# y a menudo conduce a la confusin.
#
regr<-survreg(Surv(db$time, db$event)~ 1, dist = "lognormal")
regr
sdlog <- regr$scale
meanlog <- regr$coefficients
sdlog
meanlog

VI.68
Apndices

#
x<-db$time
# par(mfrow = c(1,1))
# La Funcin de no Reparabilidad
curve(plnorm(x, meanlog=meanlog, sdlog=sdlog,lower=FALSE,log=FALSE), from=0,to=4,
main="Funcin de no Reparabilidad", ylab=expression(hat(R)(t)),
col="darkred",xlab="Tiempo de Reparacin (Das)", lwd=2, ylim=c(0,1),cex.axis=.75)
leg<-as.factor(paste(c("sdlog =","meanlog ="),
c(round(sdlog,4),round(meanlog,4))))
legend(2,0.8, levels(leg), lwd=0.0001, lty=NULL, cex=.75, bty="n")
#
# Funcin de Tasa de Reparacin
curve((dlnorm(x, meanlog=meanlog, sdlog=sdlog,log=FALSE))/(plnorm(x, meanlog=meanlog,
sdlog=sdlog,lower=FALSE,log=FALSE)),
from=0,to=4, main="Funcin de Tasa de Reparacin", ylab= expression(hat(h)(t)),
col="darkblue",xlab="Tiempo de Reparacin (Das)", lwd=2,cex.axis=.75)
leg<-as.factor(paste(c("sdlog =","meanlog ="),
c(round(sdlog,4),round(meanlog,4))))
legend(2,4, levels(leg), lwd=0.0001, lty=NULL, cex=.75, bty="n")
#
#La Funcin Acumulada de Tasa de Reparacin
curve(-plnorm(x, meanlog=meanlog, sdlog=sdlog,lower=FALSE,log=TRUE), from=0, to=4,
ylab= expression(hat(H)(t)), main="Funcin Acumulada de Tasa de Reparacin",
col="darkmagenta",xlab="Tiempo de Reparacin (Das)", lwd=2,cex.axis=.75)
leg<-as.factor(paste(c("sdlog =","meanlog ="),
c(round(sdlog,4),round(meanlog,4))))
legend(2,0.8, levels(leg), lwd=0.0001, lty=NULL, cex=.75, bty="n")
#
#

VI.69
Apndices

4.4. Simulacin
4.4.1. Generacin de Variables Aleatorias de una Distribucin Weibull
#
##########################################################################
# 4. Simulacin #
##########################################################################
#
setwd("E:/11_Master Estadstica/4_Asignaturas/2_Trabajo Fin Master/0_Practica")
#
##########################################################################
# 4.1. Simulacin Weibull #
##########################################################################
#
library(MASS)
library(car)
library(splines)
library(survival)
library(fitdistrplus)
library(Sim.DiffProc)
# Se desea simular mediante el mtodo de inversin muestras de 10, 20 y 40
# valores de una distribucin weibull) considerando que t=scale(-log(1-x))^1/shape.
# x es de una distribucin uniforme en [0, 1]
#
# Se realizaran una serie de subfunciones y en el apartado 4.1.5 una funcin conjunta
#
##########################################################################
# 4.1.1. Generacin de datos #
##########################################################################
#
# Funcin de simulacin
fwsim <- function(n, shape, scale)
{
res <- scale*(-log(1-runif(n, 0, 1)))^(1/shape)
#print(results)
print(res)
}
#
##########################################################################
# 4.1.2. Generacin Grafica #
##########################################################################
#
# Generacin Grficos Q-Q
# La funcin qqplot ()) genera grficos Quantile-Quantile plot para
# cualquier distribucin terica.
#
par(mfrow=c(1,1))
fplot <- function(x, dist = "weibull",shape, scale,
mainlab="Q-Q Plot")
{
qqPlot(x, dist = "weibull", shape = shape, scale = scale,
main=mainlab, xlab="Quantiles de Distribucin Weibull",

VI.70
Apndices

ylab="Quantiles de Datos", line="quartiles", envelope = T,


pch=21,lwd=1.9,cex=0.75,col="blue")
}
#
##########################################################################
# 4.1.3. Test de MSE (Mean Squared Error) #
##########################################################################
#
# Funcin de MSE
cpar<-function(x,shape=1,scale=1 )
{ timeSort <- sort(x)
n <- length(x)
i <- 1:n
RM <- (i-0.3)/(n+0.4) # Rango de Mediana.
Frm <- RM
Fhrm <- 1-exp(-((timeSort/scale)^shape))
Fi<-(Fhrm-Frm)^2
Fi<-data.frame(Fi)
MSE<-sum(Fi, na.rm=TRUE)
tabla=cbind(i,timeSort,Frm,Fhrm,Fi)
MSE = cbind(MSE)
# print(tabla)
print(MSE)
}
#
##########################################################################
# 4.1.4 Test de la Bondad de Ajuste #
##########################################################################
#
# 4.1.4.1. Aplicacin Conjunta de diversos Test
# Mediante la funcin gofstat del paquete fitdistrplus se realiza
# la estimacin de la bondad de ajuste para distribuciones continuas mediante
# los estadsticos de Cramer-von Mises, Kolmogorov-Smirnov y Anderson-Darling.
#
# Para conjunto de observaciones de n > 5 y distribuciones continuas,
# los test de Cramer-von Mises y Anderson-Darling se realizan sin conocimiento
# de los parmetros de la distribucin. El resultado ser la decisin de rechazar
# o no la distribucin terica con un nivel de significancia de 0.05.
# Ambos test se realizan por mxima verosimilitud
#
# Cuando se ajustan distribuciones discretas el estadstico chi-cuadrado es
# utilizado con la misma funcin pero con el argumento chisqbreaks o meancount.
#
testData <- function(x, y="weibull", shape=shape,scale= scale){
n<-length(x)
if (n <= 30) {
# test de K-S.
tmle <- suppressWarnings(fitdist(x, "weibull", method="mle"))
st <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=F)
library(Sim.DiffProc)
ks<-suppressWarnings(test_ks_dweibull(x, shape,scale))
if (ks[2] > 0.05) {

VI.71
Apndices

# res <- data.frame(n, shape, scale, round(st$cvm,4), st$cvmtest, round(st$ad, 4),


# st$adtest, round(st$ks, 4), st$kstest, row.names = "Resultados")
res <- data.frame(n, shape, scale, row.names = "Resultados")
print(res)
st <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=T)
writeLines("\n Se ACEPTA la hiptesis nula p-valor > 0.05 (nivel de significancia).
Los datos siguen una distribucin de Weibull segn test Kolmogorov Smirnov.")
} else {
res <- data.frame(n, shape, scale, row.names = "Resultados")
print(res)
st <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=T)
print(res)
writeLines("\n Se RECHAZA la hiptesis nula p-valor < 0.05 (nivel de significancia).
Los datos NO siguen una distribucin de Weibull segn test Kolmogorov Smirnov.")
}
} else {
# test de Chi-cuadrado
tmle <- suppressWarnings(fitdist(x, "weibull", method="mle"))
chi <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=FALSE)
if (chi$chisqpvalue > 0.05) {
res <- data.frame( n, shape, scale, chi$chisqpvalue,
row.names = "Resultados")
print(res)
writeLines("\n Se ACEPTA la hiptesis nula p-valor > 0.05 (nivel de significancia).
Los datos siguen una distribucin de Weibull segn test Chi-cuadrado.")
} else {
res <- data.frame(n, shape, scale, chi$chisqpvalue,
row.names = "Resultados" )
print(res)
writeLines("\n Se RECHAZA la hiptesis nula p-valor < 0.05 (nivel de significancia).
Los datos NO siguen una distribucin de Weibull segn test Chi-cuadrado.")
}
}
}
#
#
# 4.1.4.2. Test Individual de Kolmogorov Smirnov
# Mediante la funcin test_ks_dweibull del paquete Sim.DiffProc se
# realiza el test de bondad de ajuste de Kolmogorov Smirnov para contrastar si
# un conjunto de datos sigue o no un modelo de distribucin Weibull.
# library(Sim.DiffProc)
kst <- function(x, shape,scale){
ks<-test_ks_dweibull(x, shape, scale)
}
#
#
##########################################################################
# 4.1.5 Funcin conjunta de simulacin para weibull #
##########################################################################
#
Sim <- function(i,n, min, max, shape , scale, mainlab){
for(i in 1:i){

VI.72
Apndices

rep <- i
writeLines("\n \n")
tst <- data.frame( n, rep, row.names = "Simulacin ")
print(tst)
writeLines("\n ")
# Generar datos de simulacin
wsim <- fwsim(n=n, shape=shape , scale=scale)
# Generacin de Grficos
par(mfrow=c(1,1))
plot<-fplot(x=wsim, dist = "weibull",shape, scale,
mainlab=paste("Q-Q Plot para n = ", n, " - ", i))
# prueba MSE (Mean Squared Error)
cpar(x=wsim,shape=shape , scale=shape )
# Bondad de Ajuste - estadsticos
testData(x=wsim,y= "pweibull", shape=shape,scale=scale)
# Test Individual de Kolmogorov Smirnov
kst(x=wsim, shape=shape,scale=scale)
}
}
#
# Declaracin de variables
# set.seed(.01)
i <- 5 # nmero de repeticin
n<- 40 # Cantidad en muestra
shape <- 0.6299
scale <- 39.6759
#
# Ejecucin de funcin conjunta
Sim(i,n=n, shape=shape , scale=scale)
#
#

VI.73
Apndices

4.4.2. Generacin de Variables Aleatorias de una Distribucin Log-Normal


#
##########################################################################
# 4.2. Simulacin lognormal #
##########################################################################
#
setwd("E:/11_Master Estadistica/4_Asignaturas/2_Trabajo Fin Master/0_Practica")
#
library(MASS)
library(car)
library(splines)
library(survival)
library(fitdistrplus)
library(Sim.DiffProc)
# Se desea simular mediante el mtodo de inversin muestras de 10, 20 y 40
# valores de una distribucin lognormal) considerando que
# t=exp(meanlog+(sdlog*z)).
# z es de una distribucin normal en [0, 1]
#
# Se realizaran una serie de subfunciones y en el apartado 4.2.5 una funcin conjunta
#
##########################################################################
# 4.2.1. Generacin de datos #
##########################################################################
#
# Funcin de simulacin
flnsim <- function(n, meanlog, sdlog)
{
res <- exp(meanlog+(sdlog*rnorm(n,0,1)))
#print(results)
print(res)
}
#
##########################################################################
# 4.2.2. Generacin Grfica #
##########################################################################
#
# Generacin Grficos Q-Q
# La funcin qqplot ()) genera grficos Quantile-Quantile plot para
# cualquier distribucin terica.
#
par(mfrow=c(1,1))
fplot <- function(x, dist = "lnorm",meanlog, sdlog,
mainlab="Q-Q Plot")
{
qqPlot(x, dist = "lnorm", meanlog = meanlog, sdlog = sdlog,
main=mainlab, xlab="Quantiles de Distribucin lognormal",
ylab="Quantiles de Datos", line="quartiles", envelope = T,
pch=21,lwd=1.9,cex=0.75,col="blue")
}
#
##########################################################################

VI.74
Apndices

# 4.2.3. Test de MSE (Mean Squared Error) #


##########################################################################
#
# Funcin de MSE
cpar<-function(x,meanlog=1,sdlog=1 )
{
timeSort <- sort(x)
n <- length(x)
i <- 1:n
RM <- (i-0.3)/(n+0.4) # Rango de Mediana.
Frm <- RM
Fhrm <- qnorm(((log(timeSort)-meanlog)/sdlog), mean = 0,
sd = 1,lower.tail = T, log.p = F)
Fi<-(Fhrm-Frm)^2
Fi<-data.frame(Fi)
MSE<-sum(Fi, na.rm=TRUE)
tabla=cbind(i,timeSort,Frm,Fhrm,Fi)
MSE = cbind(MSE)
# print(tabla)
print(MSE)
}
#
##########################################################################
# 4.2.4 Test de la Bondad de Ajuste #
##########################################################################
#
# 4.2.4.1. Aplicacin Conjunta de diversos Test
# Mediante la funcin gofstat del paquete fitdistrplus se realiza
# la estimacin de la bondad de ajuste para distribuciones continuas mediante
# los estadsticos de Cramer-von Mises, Kolmogorov-Smirnov y Anderson-Darling.
#
# Para conjunto de observaciones de n > 5 y distribuciones continuas,
# los test de Cramer-von Mises y Anderson-Darling se realizan sin conocimiento
# de los parmetros de la distribucin. El resultado ser la decisin de rechazar
# o no la distribucin terica con un nivel de significancia de 0.05.
# Ambos test se realizan por mxima verosimilitud
#
# Cuando se ajustan distribuciones discretas el estadstico chi-cuadrado es
# utilizado con la misma funcin pero con el argumento chisqbreaks o meancount.
#
testData <- function(x, y="lnorm", meanlog=meanlog,sdlog= sdlog){
n<-length(x)
if (n <= 30) {
# test de K-S.
tmle <- suppressWarnings(fitdist(x, "lnorm", method="mle"))
st <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=F)
library(Sim.DiffProc)
ks<-suppressWarnings(test_ks_dlognorm(x, meanlog,sdlog))
if (ks[2] > 0.05) {
# res <- data.frame(n, meanlog, sdlog, round(st$cvm,4), st$cvmtest, round(st$ad, 4),
# st$adtest, round(st$ks, 4), st$kstest, row.names = "Resultados")
res <- data.frame(n, meanlog, sdlog, row.names = "Resultados")

VI.75
Apndices

print(res)
st <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=T)
writeLines("\n Se ACEPTA la hiptesis nula p-valor > 0.05 (nivel de significancia).
Los datos siguen una distribucin de lognormal segn test Kolmogorov Smirnov.")
} else {
res <- data.frame(n, meanlog, sdlog, row.names = "Resultados")
print(res)
st <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=T)
print(res)
writeLines("\n Se RECHAZA la hiptesis nula p-valor < 0.05 (nivel de significancia).
Los datos NO siguen una distribucin de lognormal segn test Kolmogorov Smirnov.")
}
} else {
# test de Chi-cuadrado
tmle <- suppressWarnings(fitdist(x, "lnorm", method="mle"))
chi <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=FALSE)
if (chi$chisqpvalue > 0.05) {
res <- data.frame( n, meanlog, sdlog, chi$chisqpvalue,
row.names = "Resultados")
print(res)
writeLines("\n Se ACEPTA la hiptesis nula p-valor > 0.05 (nivel de significancia).
Los datos siguen una distribucin de lognormal segn test Chi-cuadrado.")
} else {
res <- data.frame(n, meanlog, sdlog, chi$chisqpvalue,
row.names = "Resultados" )
print(res)
writeLines("\n Se RECHAZA la hiptesis nula p-valor < 0.05 (nivel de significancia).
Los datos NO siguen una distribucin de lognormal segn test Chi-cuadrado.")
}
}
}
#
#
# 4.2.4.2. Test Individual de Kolmogorov Smirnov
# Mediante la funcin test_ks_dlnorm del paquete Sim.DiffProc se
# realiza el test de bondad de ajuste de Kolmogorov Smirnov para contrastar si
# un conjunto de datos sigue o no un modelo de distribucin lognormal.
# library(Sim.DiffProc)
kst <- function(x, meanlog,sdlog){
ks<-test_ks_dlognorm(x, meanlog, sdlog)
}
#
#
##########################################################################
# 4.2.5 Funcin conjunta de simulacin para lognormal #
##########################################################################
#
Sim <- function(i,n, min, max, meanlog , sdlog, mainlab){
for(i in 1:i){
rep <- i
writeLines("\n \n")
tst <- data.frame( n, rep, row.names = "Simulacin ")

VI.76
Apndices

print(tst)
writeLines("\n ")
# Generar datos de simulacin
lgsim <- flnsim(n=n, meanlog=meanlog , sdlog=sdlog)
# Generacin de Grficos
par(mfrow=c(1,1))
plot<-fplot(x=lgsim, dist = "lnorm",meanlog, sdlog,
mainlab=paste("Q-Q Plot para n = ", n, " - ", i))
# prueba MSE (Mean Squared Error)
cpar(x=lgsim,meanlog=meanlog , sdlog=meanlog )
# Bondad de Ajuste - estadsticos
testData(x=lgsim,y= "plnorm", meanlog=meanlog,sdlog=sdlog)
# Test Individual de Kolmogorov Smirnov
kst(x=lgsim, meanlog=meanlog,sdlog=sdlog)
}
}
#
# Declaracin de variables
# set.seed(.01)
i <- 5 # numero de repeticin
n <- 10 # Cantidad en muestra
meanlog <- -1.38153
sdlog <- 1.28233
#
# Ejecucin de funcin conjunta
Sim(i,n=n, meanlog=meanlog , sdlog=sdlog)
#
#
#

VI.77

Potrebbero piacerti anche