Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
DepartamentodeEstadsticaeInvestigacinOperativa
V B
El Tutor
Fdo.:SilverioNavarreteMuela Fdo.:Dr.D.RafaelPrezOcn
Resumen
En los ltimos aos se ha producido una revolucin en el uso de mtodos estadsticos para mejorar
la calidad de productos y servicios, apareciendo nuevas filosofas como TPM, Lean o la metodologa
Seis Sigma. Pero es, sin duda, el inters por la mejora de la calidad en funcin del tiempo, uno de los
eslabones en los que ms se est innovando. La confiabilidad de un producto es un trmino colectivo
que se usa para describir la disponibilidad de un producto y sus factores de influencia, esto es,
fiabilidad, mantenibilidad y logstica de mantenimiento. Para evaluar los valores obtenidos de las
caractersticas de confiabilidad es necesario empleo de mtodos estadsticos.
Este TFM presenta un estudio terico-prctico sobre fiabilidad y mantenibilidad basndose para
ello en el desarrollo de funciones en R (software de libre uso), Siendo ste un lenguaje y entorno de
programacin orientado a objetos para anlisis estadstico y grfico.
Se ha realizado una introduccin al proceso de anlisis de observaciones de tiempos hasta el fallo
MTTF y tiempos de reparacin MTTR mediante mtodos grficos, no paramtricos y paramtricos,
obteniendo la distribucin terica optima en cada caso , con comparativas de los mtodos de clculo
de los parmetros obtenidos y realizndose anlisis de inferencia estadstica. Finalmente, se ha
validado el modelo terico mediante generacin y ajuste de variables aleatorias de la distribucin
seleccionada en cada caso.
R.1
R.2
TabladeContenido
Tabla de Contenido
Resumen....................................................................................................................................1
Tabla de Contenido...................................................................................................................1
Listado de Figuras.....................................................................................................................1
Listado de Tablas......................................................................................................................1
Captulo I. Introduccin............................................................................................................1
1.1 Antecedentes .......................................................................................................... 2
1.2 Objetivos de la Investigacin ................................................................................... 3
1.3 Estructura del TFM .................................................................................................. 4
Captulo II. Fundamentos Tericos...........................................................................................1
2.1 Introduccin ............................................................................................................ 2
2.2. Conceptos Fundamentales...................................................................................... 4
2.2.1. Confiabilidad...........................................................................................................4
2.2.1.1. Coste del Ciclo de Vida .................................................................................................. 5
2.2.1.2. Costes Relativos a la Confiabilidad ................................................................................ 6
2.2.2. Disponibilidad..........................................................................................................7
2.2.3. Fiabilidad.................................................................................................................8
2.2.3.1. Fiabilidad en Funcin del Tiempo ................................................................................. 8
2.2.3.2. Medidas de Fiabilidad ................................................................................................... 8
2.2.3.3. Distribuciones Estadsticas .......................................................................................... 14
2.2.3.3.1.DistribucinNormal ............................................................................................. 14
2.2.3.3.2.DistribucinLog-Normal ...................................................................................... 18
2.2.3.3.3.DistribucinExponencial ...................................................................................... 21
2.2.3.3.4.DistribucinWeibull ............................................................................................. 24
2.2.3.3.5.DistribucindeGamma ........................................................................................ 29
2.2.3.3.6.DistribucinErlang ............................................................................................... 32
2.2.4. Mantenibilidad......................................................................................................35
2.2.5. Soporte de Mantenimiento...................................................................................37
2.3. Mtodos Estadsticos de Estimacin de la Fiabilidad y el Mantenimiento. ............. 37
2.3.1. Caractersticas de los Datos..................................................................................39
2.3.1.1. Censura........................................................................................................................ 39
2.3.1.1.1.CensuraporlaDerecha ........................................................................................ 40
2.3.1.1.1.1.CensuraTipoI ................................................................................................ 40
2.3.1.1.1.2.CensuraTipoII ............................................................................................... 43
2.3.1.1.1.3.CensuraTipoIIIoAleatoria ........................................................................... 44
C.1
TabladeContenido
2.3.1.1.2.CensuraporlaIzquierda....................................................................................... 45
2.3.1.1.3.CensuraporIntervalo ........................................................................................... 45
2.3.1.2. Truncamiento .............................................................................................................. 45
2.3.1.2.1.TruncamientoporlaIzquierda ............................................................................. 46
2.3.1.2.2.TruncamientoporlaDerecha ............................................................................... 46
2.3.2. Estimacin no Paramtrica...................................................................................46
2.3.2.1. Tablas de Vida ............................................................................................................. 47
2.3.2.2. Estimador de Kaplan-Meier (KM) de la Funcin de Fiabilidad. ................................... 50
2.3.2.2.1.IntervalodeConfianzaUsandolaTransformacinlog ........................................ 51
2.3.2.2.2.IntervalodeConfianzaUsandolaTransformacinlog-log .................................. 52
2.3.2.2.3.PropiedadesdelEstimadorKaplan-Meier ............................................................ 53
2.3.2.3. Estimador de Kaplan- Meier Ponderado (KMP) .......................................................... 53
2.3.2.4. Estimador Nelson-Aalen (NA) de la Funcin de Riesgo Acumulado ........................... 55
2.3.2.5. Estimadores de la Funcin de Fiabilidad para Datos Truncados a la Izquierda y
Censurados a la Derecha .......................................................................................................... 56
2.3.2.5.1.EstimadordeTurnbull .......................................................................................... 57
2.3.2.5.2.EstimadordeNelson-AalenExtendido(NAE) ....................................................... 57
2.3.2.6. Comparacin de Funciones de Fiabilidad.................................................................... 58
2.3.3. Estimacin Paramtrica........................................................................................60
2.3.3.1. Estimacin Grfica....................................................................................................... 60
2.3.3.1.1.EstimacinconDatosnoCensurados................................................................... 61
2.3.3.1.1.1.LinealizacindeunaDistribucin. ................................................................. 62
2.3.3.1.1.1.1. Linealizacin de la f.d. Asociada a una Distribucin Exponencial .......... 62
2.3.3.1.1.1.2. Linealizacin de la f.d. Asociada a una Distribucin Weibull ................. 62
2.3.3.1.1.2.ConstruccindePlantillasEspecialesparaGrficosdeProbabilidad ........... 63
2.3.3.1.1.3Estimacindelaf.d.Emprica. ....................................................................... 64
2.3.3.1.1.4.IdentificacinGraficadelaDistribucindeAjuste........................................ 66
2.3.3.1.2.EstimacinconDatosCensurados........................................................................ 66
2.3.3.1.2.1.ConstruccindelGrficodeRiesgo(HazardPlots). ...................................... 67
2.3.3.1.2.2.EstimacinEmpricadeRiesgoAcumuladoparaWeibull ............................. 67
2.3.3.2. Estimacin Puntual. ..................................................................................................... 69
2.3.3.2.1.EstimacinporMnimosCuadrados(LeastSquaresMethod(LSM)) ................... 69
2.3.3.2.1.1.EstimacindeParmetrosparalaDistribucinExponencial ........................ 70
2.3.3.2.1.2.EstimacindeParmetrosparalaDistribucinWeibull ............................... 70
2.3.3.2.2.EstimacinporMximaVerosimilitud(MaximumLikelihoodEstimator(MLE)) . 71
2.3.3.2.2.1.EstimacindeParmetrosenObservacionesCompletas ............................. 71
C.2
TabladeContenido
C.3
TabladeContenido
C.4
TabladeContenido
C.5
TabladeContenido
4.3.2.3.2.2.EstimacionesparaObservacionesconCensura ............................................ 45
4.3.2.3.2.EstimacinporMomentos ................................................................................... 46
4.3.2.4. Estimacin de Parmetros por Intervalos. ................................................................ 46
4.3.2.4.1.EstimacinporMnimosCuadrados..................................................................... 46
4.3.2.4.2.EstimacinporMximaVerosimilitud ................................................................. 47
4.3.2.5. Comparacin de Mtodos de Estimacin de Parmetros......................................... 48
4.3.2.6. Bondad de Ajuste ....................................................................................................... 49
4.3.2.6.1.TestdeBondaddeajusteparaMnimosCuadrados ............................................ 49
4.3.2.6.1.1.Interpretacindelosresultados .................................................................... 49
4.3.2.6.1.2.ANOVAyTestdeindependencialineal ......................................................... 50
4.3.2.6.1.2.1. Anlisis de varianza del modelo de regresin lineal .............................. 50
4.3.2.6.1.2.2. Test de independencia lineal y correlacin lineal .................................. 51
4.3.2.6.2.TestdelaBondadMedianteEstadsticos ............................................................. 51
4.3.2.7. Propiedades del Mantenimiento ............................................................................... 53
4.3.2.6.1.FuncindeDensidaddeProbabilidaddeReparacinf(t) .................................... 53
4.3.2.7.2.FuncindeMantenibilidadM(t). .......................................................................... 53
4.3.2.7.3.FuncindenoReparabilidadRr(t). ....................................................................... 54
4.3.2.7.4.FuncindeTasadeReparacinh(t). .................................................................... 55
4.3.2.7.5.FuncindeTasadeReparacinAcumuladaH(t). ................................................ 55
4.3.2.7.6.MediaoEsperanzaMatemtica=E[T]. ............................................................ 56
4.3.2.7.7.VarianzaVar[T]. ................................................................................................... 56
4.3.2.7.8.p-cuantil................................................................................................................ 56
4.3.3. Anlisis No Paramtrico........................................................................................56
4.3.3.1. Funcin de no Reparabilidad....................................................................................... 57
4.3.3.2. .Funcin de Mantenibilidad M(t) ................................................................................ 60
4.3.3.3. Funcin Tasa de Reparacin Acumulada..................................................................... 60
4.3.3.4. Ajuste de Datos Tiempo-Evento (no Reparabilidad) a Modelos Paramtricos ........... 62
4.3.3.4.1.FuncindenoReparabilidad ................................................................................ 62
4.3.3.4.2.FuncindeTasadeReparacinh(t) ..................................................................... 63
4.3.3.4.3.FuncindeTasadeReparacinAcumulada......................................................... 63
4.3.3.5. Estimacin No Paramtrica ......................................................................................... 64
4.3.4. Anlisis Comparativo no Paramtrico y Paramtrico..........................................65
4.3.4.1. Funcin de Mantenibilidad M(t). ................................................................................ 66
4.3.4.2. Funcin de no Reparabilidad Rr(t). .............................................................................. 66
4.3.4.3. Funcin de Tasa de Reparacin h(t). ........................................................................... 66
4.3.4.4. Funcin de Tasa de Reparacin Acumulada H(t). ....................................................... 67
C.6
TabladeContenido
C.7
TabladeContenido
C.8
ListadodeFiguras
Listado de Figuras
F.1
ListadodeFiguras
Figura 45. Frecuencias Esperadas y Observadas de una Muestra con la lnea de ajuste a una
distribucin Normal.............................................................................................................................. 90
Figura 46. Relacin entre x e y valores de R2 ....................................................................................... 91
Figura 47. Sistema en Serie Formado por Tres Componentes ............................................................. 93
Figura 48. Sistema en Paralelo con Tres Componentes ....................................................................... 94
Figura 49. Sistema 2 Componentes en Serie entre 3 en Paralelo. ....................................................... 94
Figura 50: Procedimiento Metodolgico en Fiabilidad y Mantenimiento. ............................................ 3
Figura 51: Histograma de Tiempo Operativo de los Dispositivos. ......................................................... 4
Figura 52. Diagrama de Cajas de Tiempo Operativo de los Dispositivos. .............................................. 5
Figura 53. Funcin de Supervivencia Estimada con Intervalo de Confianza. ......................................... 8
Figura 54. Comparativa de Mtodos de Estimacin de la Funcin de Supervivencia ........................... 9
Figura 55. Funcin de Distribucin......................................................................................................... 9
Figura 56. Funciones de Riesgo Acumulado. ........................................................................................ 10
Figura 57. Comparativa de Mtodos de Estimacin de la Funcin de Riesgo Acumulado .................. 10
Figura 58. Funcin de Supervivencia con Modelos Paramtricos........................................................ 11
Figura 59. Funcin de Riesgo con Modelos Paramtricos ................................................................... 12
Figura 60. Funcin de Riesgo Acumulado con Modelos Paramtricos ................................................ 12
Figura 61. Funcin de Supervivencia o Fiabilidad Weibull Figura 62. Funcin de Riesgo Weibull .. 13
Figura 63. Funcin de Riesgo Acumulado Weibull ............................................................................... 14
Figura 64. Modelacin de las Observaciones con varias Distribuciones Tericas ............................... 15
Figura 65. Grfico de Probabilidad de Weibull .................................................................................... 18
Figura 66. Grfico de Probabilidad para obtencin de parmetros de la distribucin de Weibull ..... 19
Figura 67. Grfico de ajuste a una distribucin de Weibull ................................................................. 20
Figura 68. Grfico de evaluacin de residuos ...................................................................................... 20
Figura 69. Intervalos de Confianza y Prediccin al 95% ....................................................................... 23
Figura 70. Funcin de Densidad ........................................................................................................... 30
Figura 71. Funcin de Distribucin....................................................................................................... 31
Figura 72. Funciones de Fiabilidad o Supervivencia............................................................................. 32
Figura 73. Funcin de Riesgo o Tasa de Fallo ....................................................................................... 33
Figura 74. Funcin de Riesgo Acumulado ............................................................................................ 34
Figura 75. Funcin de Distribucin F(t) Paramtrica (izq.) y Funcin no Paramtrica (der.) ............... 35
Figura 76. Funcin de Fiabilidad R(t) o Supervivencia S(t) Paramtrica (izq.) y Funcin no Paramtrica
(der.) ..................................................................................................................................................... 35
Figura 77. Funcin de Riesgo o Tasa de Fallo h(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)36
Figura 78. Funcin de Riesgo Acumulado H(t) Paramtrica (izq.) y Funcin no Paramtrica (der.) .... 36
Figura 79: Histograma de Tiempo de reparacin de los Dispositivos. ................................................. 38
Figura 80. Diagrama de Cajas de Tiempo de Reparacin de los Dispositivos. ..................................... 38
Figura 81. Modelacin de las Observaciones con varias Distribuciones Tericas ............................... 40
Figura 82. Grfico de Linealizacin de la Funcin de no Reparabilidad ............................................... 43
Figura 83. Grfico de ajuste a una distribucin Lognormal ................................................................. 44
Figura 84. Intervalos de Confianza y Prediccin al 95% ....................................................................... 47
Figura 85. Funcin de Densidad de Probabilidad de Reparacin......................................................... 53
Figura 86. Funcin de Mantenibilidad.................................................................................................. 54
Figura 87. Funciones de no Reparabilidad. .......................................................................................... 54
Figura 88. Funcin de Tasa de reparacin............................................................................................ 55
Figura 89. Funcin de Riesgo Acumulado ............................................................................................ 56
Figura 90. Funcin de no Reparabilidad - Estimada con Intervalo de Confianza. ................................ 59
Figura 91. Comparativa de Mtodos de Estimacin de la Funcin de no reparabilidad ..................... 59
F.2
ListadodeFiguras
F.3
ListadodeFiguras
F.4
ListadodeTablas
Listado de Tablas
T.1
ListadodeTablas
T.2
Captulo I. Introduccin
CaptuloI.Introduccin
1.1 Antecedentes
La gran mayora de los dispositivos fsicos o tangibles sufren un proceso de degradacin causado
por el paso del tiempo y/o por su utilizacin. Ello significa que, a menos que se tomen medidas de
mantenimiento eficaces, cualquier dispositivo (componente o sistema) acabar fallando, i.e.:
eventualmente, el dispositivo dejar de ser operativo (dejar de realizar correctamente la funcin
que le haba sido asignada). Por tanto, se exige que los productos sean fiables. Deben desempear
sus funciones de forma segura sin excesivo impacto en el medioambiente y ser fciles de mantener
durante su vida til y as lograr la satisfaccin del cliente.
La confiabilidad de un producto es un trmino colectivo que se usa para describir la
disponibilidad de un producto y sus factores de influencia, esto es, fiabilidad, mantenibilidad y
logstica de mantenimiento.
Uno de los factores de mayor incidencia es la fiabilidad de un dispositivo (componente o
sistema), definindose como la probabilidad de que ste funcione correctamente (sobreviva sin
fallo) durante un determinado perodo de tiempo, sometido a unas condiciones de trabajo
concretas. As pues, la fiabilidad constituye un aspecto fundamental de la calidad de todo
dispositivo. Por tal motivo, resulta especialmente interesante la cuantificacin de dicha fiabilidad, de
forma que sea posible hacer estimaciones sobre la vida til del producto.
As, por ejemplo, en el caso de una avioneta monomotor, ser de gran conveniencia conocer la
probabilidad de que esta falle en diferentes etapas de su vida (tras 500 horas de funcionamiento,
800 horas de funcionamiento, etc.). El obtener una buena estimacin de la fiabilidad del motor,
posibilitar la toma de decisiones racionales acerca de cundo conviene revisarlo o cambiarlo por
otro nuevo.
Ciertas tcnicas en especial las no paramtricas, fueron inicialmente desarrolladas para su uso en
estudios mdicos y biolgicos (es decir, considerando entidades orgnicas en lugar de dispositivos)
bajo el nombre genrico de anlisis de supervivencia (comparacin de diferentes tratamientos
mdicos, determinacin de los factores que intervienen en la supervivencia de los peces de un ro,
etc.).
En la actualidad, sin embargo, la aplicacin de dichas tcnicas, en especial las paramtricas, se ha
extendido a otras reas como la econmica o la industrial bajo el nombre de anlisis de tiempos de
fallo (establecimiento de perodos de garanta de un producto, diseo de planes de mantenimiento
preventivo, etc.).
I.2
CaptuloI.Introduccin
I.3
CaptuloI.Introduccin
I.4
CaptuloI.Introduccin
I.5
CaptuloII.FundamentosTericos
2.1 Introduccin
En la actualidad, la fiabilidad, la mantenibilidad y la disponibilidad son caractersticas esenciales de
funcionamiento de los sistemas. Estas caractersticas, junto con el funcionamiento del soporte de
mantenimiento se conocen colectivamente como confiabilidad.
Pero en sus inicios, el enfoque inicial fue realizado sobre la fiabilidad, atribuyendo su origen de
estudio a la evaluacin de la mortalidad derivada de las epidemias y a los mtodos actuariales
desarrollados por las compaas de seguros, para determinar el riesgo de sus plizas. La herramienta
utilizada para el clculo de esta fiabilidad eran las tablas de vida.
A principios de 1900 se utilizaban los mtodos actuariales para estudiar la supervivencia de
pacientes con determinados tratamientos y para estudiar la fiabilidad de los ferrocarriles. La teora
matemtica de la fiabilidad se desarrolla por las demandas de la tecnologa. El rea de mantenimiento
de mquinas es donde la fiabilidad se aplica con sofisticadas tcnicas matemticas.
En 1939 Walodie Weibull, propuso una distribucin para describir la duracin de los materiales,
que ms tarde se denominara distribucin de Weibull. Esta distribucin es utilizada en infinidad de
aplicaciones debido a su gran versatilidad.
En 1953 Epstein y Sobel comenzaron a trabajar con la distribucin Exponencial como modelo para
estudiar la vida til de un dispositivo en funcin del tiempo. La distribucin exponencial no tiene
memoria, es decir, el tiempo de vida til de un determinado dispositivo no influye en la probabilidad
de que este falle. La popularidad de esta distribucin es el gran uso que se ha hecho de ella en trabajos
de fiabilidad debido a su simplicidad en los clculos.
En los aos noventa, la investigacin de la fiabilidad toma nuevas direcciones gracias a M. B.
Mendel. Sus mtodos se pueden encontrar en publicaciones sobre problemas de fiabilidad en la
ingeniera, entre los que destacan los de Shortle y Mendel (1996).
Una definicin probabilstica de la fiabilidad la presenta Meeker y Escobar (1998), que la define
como la probabilidad de que una unidad realice su funcin hasta un tiempo especificado bajo las
condiciones de uso encontradas.
Otra perspectiva, orientada hacia el cliente o usuario del producto final, es la proporcionada por
Condra (2001), que afirma que un producto fiable es aquel que hace lo que el usuario quiere que
haga cuando el usuario quiere que lo haga. De acuerdo con esta definicin, la fiabilidad sera calidad
a travs del tiempo.
Dependiendo del enfoque dado a la fiabilidad, puede tambin encontrarse su vinculacin con el
concepto de misin, esta idea aparece vinculada a los inicios de estos estudios, en el contexto de
equipos diseados para su uso militar, aunque hoy en da sigue siendo utilizada tambin en diferentes
campos. En este caso, se transforma el concepto de fiabilidad a confiabilidad, a que el equipo funcione
correctamente durante el tiempo de misin.
II.2
CaptuloII.FundamentosTericos
Histricamente, parte de la metodologa sobre estimacin de la vida til de los productos fue
inicialmente desarrollada para materiales militares. Uno de los primeros ejemplos constatados de
anlisis de tiempos de vida fue el empleado para estimar el nmero de repuestos necesarios para
mantener equipos electrnicos y mecnicos funcionando en forma intensiva por perodos largos de
tiempo durante la guerra de Corea. Los responsables de armamento verificaron que uno de los
problemas de fallos estaba relacionado con las condiciones ambientales extremas.
En algunos sectores de la industria, como en ingeniera la fiabilidad est orientada al estudio de los
tiempos de fallo. El problema reside en predecir si se puede producir un fallo y cundo ocurrir. Esta
informacin es muy til para las polticas de mantenimiento e inspeccin de una empresa as como
los plazos de garanta de los productos. Tambin es muy til para predecir costes debidos al
mantenimiento y a los fallos ocasionales que pueden ocurrir durante el tiempo de vida del dispositivo.
Mientras que en el sector farmacutico o el alimentario, se usa un trmino ms especfico, estabilidad,
para referirse a los casos en que la fiabilidad depende de la conservacin de una determinada
composicin qumica. En las ciencias de la salud, en las que se tratan cuestiones bastante parecidas a
las de la fiabilidad, se usa la expresin anlisis de la supervivencia, siendo en este campo en el que se
ha investigado con ms ahnco en la implementacin de nuevos mtodos estadsticos. Estos estudios
de Supervivencia, centrados en estimar la vida de los enfermos, se pueden y deben aprovechar para
la estimacin de tiempos de vida de productos industriales.
Aunque los estudios de fiabilidad son de gran utilidad en todas las ramas de la industria por su
amplia aplicacin, han surgido tcnicas y normativas especficas para el estudio de la fiabilidad de
componentes electrnicas y para la fiabilidad de los programas informticos, rama esta ltima que se
engloba en la denominada fiabilidad del software. As, Lawless (2000) dice la fiabilidad se refiere al
funcionamiento adecuado de equipos y sistemas, lo cual incluye factores como software, hardware,
humanos y ambientales.
Al igual que ocurre en el caso de la calidad, tambin existen normativas especficas que regulan la
fiabilidad, la mantenibilidad y la disponibilidad, entre ellas cabe destacar la norma UNE-EN 60300 de
Gestin de la confiabilidad.
II.3
CaptuloII.FundamentosTericos
Figura1.RelacionesdelaConfiabilidad
Por tanto, es esencial que se gestione activamente la confiabilidad a lo largo del ciclo de vida del
sistema. Esto abarca tanto el proceso de adquisicin como el de utilizacin, y las actividades de gestin
requeridas sern distintas en uno y otro caso. Si la confiabilidad no se gestiona adecuadamente ya sea
en el proceso de adquisicin o durante la utilizacin, existe una mayor probabilidad de que no se
alcancen los requisitos de fiabilidad o de disponibilidad.
El ciclo de vida del sistema puede tener un efecto significativo en la confiabilidad conseguida del
sistema. Adems, la fiabilidad puede variar a lo largo de la vida, ya que muchos sistemas pueden
presentar tasas de fallo variables con el uso, debido a desgaste de componentes o subsistemas. Esta
variacin de las caractersticas de fiabilidad con el uso significa que, para muchos sistemas, no es vlida
la hiptesis de tasa de fallo constante y que tienen que emplearse distintas distribuciones de
probabilidad, que requieren expresiones matemticas ms complejas, para estimar las caractersticas
de fiabilidad (IEC 61649, IEC 61703 e IEC 61710).
II.4
CaptuloII.FundamentosTericos
Los cambios en el uso del sistema son un factor adicional que afecta a las caractersticas de
fiabilidad. As, la misin o el uso del sistema son una parte esencial de la especificacin de confiabilidad
y tienen que observarse y gestionarse los cambios como parte del ciclo de vida de confiabilidad.
Figura2.RelacinentreCosteyFiabilidad
La figura 2 muestra que hay un nivel de fiabilidad para el que se minimizan los costes totales
durante la vida del sistema. Si se trata de un sistema comercial, este nivel mnimo de coste cambiar
en la medida en que los costes de diseo y desarrollo puedan repartirse entre muchas unidades. Sin
embargo, la fiabilidad ptima de un sistema puede estar afectada por otros aspectos tales como los
requisitos de seguridad o la funcin del sistema y no tiene por qu coincidir, necesariamente, con la
fiabilidad correspondiente al mnimo coste del ciclo de vida.
II.5
CaptuloII.FundamentosTericos
Figura3.RelacinTpicaentreConfiabilidadyCostedelCiclodeVidaparalaFasedeOperacinyMantenimiento
II.6
CaptuloII.FundamentosTericos
Soporte de mantenimiento.
2.2.2. Disponibilidad
Para algunos sistemas, especialmente para sistemas complejos, es necesario considerar
conjuntamente la fiabilidad y el mantenimiento. En tales sistemas puede ser conveniente especificar
requisitos de disponibilidad a nivel de sistema en vez de especificar por separado requisitos de
fiabilidad y de mantenibilidad. Los requisitos de disponibilidad en rgimen permanente son los ms
comnmente utilizados aunque tambin puede ser adecuada la disponibilidad media.
Industrias en las que la disponibilidad puede ser la principal caracterstica de confiabilidad, son,
por ejemplo, el sector ferroviario, en el que los operadores ferroviarios exigen un porcentaje de trenes
disponibles para su utilizacin durante periodos de punta o un retraso mximo, y el sector de las
telecomunicaciones, donde el operador requiere un cierto nmero de canales de comunicacin
disponibles, de forma que el sistema mantenga una disponibilidad general, aunque ciertas rutas
puedan estar no disponibles debido a los distintos enrutamientos existentes.
Se define la disponibilidad D(t) como la probabilidad en el tiempo de asegurar un servicio
requerido. Otra definicin comn en para la disponibilidad es: el porcentaje de equipos o sistemas
tiles en un determinado momento, frente a la totalidad de equipos o sistemas.
La ecuacin de la disponibilidad est en funcin de la fiabilidad y de la mantenibilidad, siendo:
R t MTBF
D t
R t M t MTBF MTTR
En la Figura 4 se aprecia cmo se conforman el MTBF (Mean Time Between Failures) .por los
distintos TBF que hacen referencia al tiempo de funcionamiento de un activo y el MTTR (Mean Time
To Restoration) por los TTR que se refieren a los tiempos de paradas por reparacin.
Figura4.RepresentacindelosEstadosTBFyTTR.
II.7
CaptuloII.FundamentosTericos
2.2.3. Fiabilidad
2.2.3.1. Fiabilidad en Funcin del Tiempo
En algunos sistemas, es necesario considerar directamente su fiabilidad. En tales sistemas, puede
ser apropiado especificar por separado los requisitos de fiabilidad y de mantenibilidad a nivel del
sistema. Por definicin, la fiabilidad es la capacidad de un sistema para realizar una funcin requerida
en condiciones determinadas durante un intervalo de tiempo dado, esto es sin fallo.
Sin embargo, muchas especificaciones definirn la fiabilidad requerida mediante el empleo de
medidas alternativas, tales como el tiempo medio hasta el fallo (MTTF) (Mean Time To Failure) o el
tiempo medio de operacin entre fallos (MTBF) (Mean Time Between Failures).
Una definicin correcta de la fiabilidad sera como la probabilidad de que el sistema complete su
funcionamiento satisfactorio a lo largo del tiempo. El supuesto subyacente implcito es que en una
muestra de dispositivos idnticos, la supervivencia (o duracin de vida) se dispersa de una manera
que se modela bien con la probabilidad y, por tanto, con una funcin de distribucin. Por tanto, la
extensin de las medidas de fiabilidad para incluir el tiempo implica la especificacin de las
distribuciones de probabilidad, las cuales deben ser modelos razonables de la dispersin de duracin
de vida.
Entre las industrias en las que las caractersticas de fiabilidad pueden ser la principal caracterstica
de confiabilidad, se pueden citar la industria aeroespacial, donde una vez que un avin ha despegado
es esencial que complete el vuelo sin un fallo total y la industria automovilstica, donde el conductor
necesita llegar a su destino y puede efectuar el mantenimiento del vehculo una vez que se encuentra
en su destino.
Por tanto, es conveniente distinguir entre productos reparables y no reparables:
Productos no reparables: solo un fallo puede ocurrir. Ejemplos: bombillas de luz,
transistores, motores a propulsin, microprocesadores, etc.
Productos reparables: ms de un fallo puede ocurrir. En este caso es importante considerar
la disponibilidad del producto reparado (que depender de la ocurrencia de fallos y del
tiempo de mantenimiento. Ejemplos: automviles, lavadoras, etc.
II.8
CaptuloII.FundamentosTericos
MTBF R t dt
0
En la prctica, la fiabilidad se mide como el tiempo medio entre dos fallos consecutivos
MTBF. Se puede medir en general por horas, kilmetros, horas de vuelo, piezas
producidas,... etc.
R(t) es la Funcin de Fiabilidad (Reliability Function) o funcin de supervivencia en el
tiempo t, o dicho de otro modo, la probabilidad de que un componente nuevo sobreviva
ms del tiempo t, donde T se define de forma genrica como el tiempo de vida del
componente, siendo una variable continua y que toma valores en el intervalo [0, ).
R t P t f t dt 1 F t
t
R lim 1 F t 0
t
y
lim F t 1
t
II.9
CaptuloII.FundamentosTericos
La vida esperada o MTBF para sistemas no reparables, se convierte en tiempo medio hasta
el fallo (MTTF) (Mean Time To Failure).
Un concepto importante a considerar cuando se trabaja con distribuciones asociadas a
tiempos de vida es la FuncindeRiesgo (hazard function)oTasadeFallo (failure rate) h(t),
que se define como la probabilidad instantnea de que una componente falle en el
instante t. En trminos de probabilidad se interpreta como el lmite de la probabilidad
condicionada de que T falle antes del tiempo t + t conociendo que no haba fallado en el
instante t. Esto no es ms que el cociente entre la funcin de densidad f(t) y la funcin de
fiabilidad R(t). Entonces, la funcin de riesgo h(t) seria:
f t
h t
R t
La funcin de riesgo h(t) es una caracterstica importante de las distribuciones asociadas a variables
correspondientes a tiempos de vida:
Funciones de riesgo decrecientes.
Se observa en productos cuya probabilidad de fallo es menor cuando aumenta el tiempo
de supervivencia. Esto aparece a menudo en cualquier tipo de materiales: al principio de
su funcionamiento la probabilidad de fallo es alta debido a la existencia de posibles
defectos ocultos. A medida que transcurre el tiempo est probabilidad se estabiliza a un
nivel ms bajo, pues si el elemento ha sobrevivido ser porque no tena ese defecto oculto.
Funciones de riesgo constantes.
Indica que la probabilidad de fallo instantneo es la misma en cualquier momento y
consecuentemente el proceso no tiene memoria, ya que la posibilidad de fallo estando
funcionando, es idntica en cualquier momento de la vida del componente. A pesar de que
esto pueda parecer irreal, este tipo de modelo es muy utilizado en la prctica, tanto por su
II.10
CaptuloII.FundamentosTericos
sencillez como por el hecho de que representa bien los periodos intermedios de vida de
muchos productos. Por ejemplo si se tienen componentes electrnicos cuya es vida es muy
larga instalados en sistemas que cuentan con elementos mecnicos de vida til muy
inferior, el modelo de tasa de fallos constante es perfectamente adecuado.
Cabe esperar tasas de fallo constantes cuando el fallo se produce por cargas excesivas que
se producen aleatoriamente en el tiempo.
Tienden a aparecer en conjuntos donde los fallos son debidos a un fenmeno aleatorio
como accidentes o shocks.
Funciones de riesgo crecientes.
Surgen, en la mayora de los casos por desgastes y fatigas, es decir por un proceso de
envejecimiento. La tasa de fallos creciente indica que la probabilidad de fallo inmediato,
teniendo en cuenta que el componente est funcionando, se incrementa a medida que
pasa el tiempo. Evidentemente a medida que un componente se hace ms viejo, su tasa
de fallos tender a crecer.
Figura5.CurvadeDaviesoBaeradelaFuncindeRiesgoCombinado.
II.11
CaptuloII.FundamentosTericos
Estudios actualizados en el sector aeronutico y militar principalmente, han demostrado que los
mecanismos de formacin de fallos no tienen por qu seguir las pautas de la combinacin de las tres
formas de riesgo o fallo indicadas anteriormente (curva de Davies o baera).
En la Figura 6 se presentan las distintas curvas de fallos a lo largo del tiempo y el porcentaje de
cada uno ellos segn un estudio de la FAA (Federal Aviation Agency) Americana.
Figura6.DiferentesCurvasdeFallosenelTiempoenelSectorAeronutico
Curva A. La curva de Davies: Alta mortalidad infantil, seguida de un bajo nivel de fallos
aleatorios, terminado en una zona de desgaste. Slo un 4% de los fallos siguen esta curva.
Coincide con equipos mecnicos histricos.
CurvaB. El tradicional punto de vista: Pocos fallos aleatorios, terminando en una zona de
desgaste. Slo un 2% de los fallos siguen esta curva. Coincide con Equipos o Sistemas
sometidos a fatiga y no diseados para vida infinita como por ejemplo sistemas
electrnicos discretos.
Curva C. Un constante incremento en la probabilidad de fallo. Slo un 5% de los fallos
siguen esta curva. Coincide con equipos o sistemas sometidos a corrosin.
II.12
CaptuloII.FundamentosTericos
La conclusin obtenida del estudio de la aviacin fue que slo un 6% siguen el desarrollo de fallos
segn las funciones A+B, y slo en stas, ser efectivo la aplicacin de los mantenimientos
preventivos.
Por lo tanto, existe otro 94 % de fallos que debido a su alta componente aleatoria de aparicin de
los fallos no se consideraba inicialmente realizar un mantenimiento preventivo. ste slo inducir en
la aparicin de nuevos fallos por la manipulacin innecesaria de los equipos y producir un aumento
en los costes por mantenimiento.
En la Figura 7 se muestra las tres funciones que forman la curva de Davies
Figura7.FuncionesqueFormanlaCurvadeDavies.
En la Figura 8 se presenta una matriz con las posibles soluciones en funcin del tipo de fallo
producido.
II.13
CaptuloII.FundamentosTericos
Figura8.SolucionesposiblessegntipodeFallos.
II.14
CaptuloII.FundamentosTericos
Figura9.FuncindeDensidaddeunaNormal.
II.15
CaptuloII.FundamentosTericos
Figura10.FuncindeDistribucindeunaNormal.
La Funcin de Fiabilidad decrece a cero con mayor rapidez para valores pequeos de
desviacin tpica., como se aprecia grficamente en la figura 11.
1 t 2
1 2
R t e dx
t 2
Figura11.FuncionesdeFiabilidaddeunaNormal.
II.16
CaptuloII.FundamentosTericos
2 2
Erfc t e t dt
t
Figura12.FuncindeRiesgooTasadeFallodeunaNormal.
Figura13.FuncindeRiesgoAcumuladodeunaNormal.
La VarianzaVar[T] seria:
Var T 2
II.17
CaptuloII.FundamentosTericos
Normal sera:
1 ln t 2
1 2
f t e
t0
t 2
En la figura 14 se representa la funcin de densidad para la distribucin Log-Normal para
= 1 y = 0.25, 0.5, 1, 1.5.y 2.
Figura14.FuncindeDensidaddeunaLog-Normal.
II.18
CaptuloII.FundamentosTericos
lnt
F t
donde es la funcin de DistribucinNormalEstndar indicada en el apartado 2.2.3.3.1.
La funcin de distribucin est representada en la figura 15, teniendo cierta similitud a la
funcin de densidad de la distribucin normal.
Figura15.FuncindeDistribucindeunaLog-Normal.
lnt
R t 1 F t 1
Figura16.FuncionesdeFiabilidaddeunaLog-Normal.
II.19
CaptuloII.FundamentosTericos
Figura17.FuncindeRiesgooTasadeFallodeunaLog-Normal.
Figura18.FuncindeRiesgoAcumuladodeunaLog-Normal.
II.20
CaptuloII.FundamentosTericos
2
E T e 2
La VarianzaVar[T] seria:
2
Var T e 2 1 e 2
El p-cuantil estara indicado por:
2 InverseErfc 2 p
tp e
Figura19.FuncindeDensidaddeunaExponencial.
II.21
CaptuloII.FundamentosTericos
Figura20.FuncindeDistribucindeunaExponencial.
Figura21.FuncionesdeFiabilidaddeunaExponencial.
II.22
CaptuloII.FundamentosTericos
Figura22.FuncindeRiesgooTasadeFallodeunaExponencial.
Figura23.FuncindeRiesgoAcumuladodeunaExponencial.
II.23
CaptuloII.FundamentosTericos
donde
MTBF: Tiempo medio entre fallos en sistemas reparables.
MTTF: Tiempo medio hasta el fallo en sistemas no reparables
La VarianzaVar[T] se expresara mediante:
t
2
2 1
Var T t f t dt t e dt 2
0 0
El p-cuantil estara indicado por:
1
tp log 1 p
Se suele aplica esta la distribucin en las siguientes situaciones:
En componentes de vida til muy larga, que excede la vida de servicio de los sistemas de
los que forman parte. Es el caso de componentes electrnicos.
En componentes que se sustituyen preventivamente antes de que llegue el desgaste.
En sistemas en serie compuestos de bloques exponenciales y, en la prctica, en sistemas
reparables muy complejos en los que no haya redundancias dominantes.
Es evidente que en los dos primeros casos, no es en rigor la vida media , pues slo se tiene en
cuenta la parte central de la curva de la baera. Por ello, el parmetro , tratndose de componentes
sujetos a desgaste, aunque empleados slo durante su vida til, es una vida media ficticia.
En el caso de sistemas que fallan exponencialmente, se reparan y siguen funcionando, es el
tiempo medio entre fallos (MTBF). Evidentemente, los sistemas reparables tienen una nueva vida
despus de cada reparacin. La distribucin de fallos, en general, puede variar a cada fallo, por
desgaste de los componentes que no han fallado y siguen en el sistema.
En el caso de sistemas de distribucin de fallo exponencial y no reparables, sera el tiempo medio
que transcurre hasta el fallo (MTTF).
No obstante, para los sistemas citados en el tercer apartado, las sucesivas distribuciones son
rigurosa o aproximadamente iguales, conservando el mismo valor de .
II.24
CaptuloII.FundamentosTericos
preferido de ajuste de datos a una distribucin de frecuencias cuando no hay normalidad. Esta
distribucin es triparamtrica (, , ), es decir, se define mediante tres parmetros y es quiz el
modelo ms utilizado para tratar problemas con tiempos de vida en fiabilidad industrial.
En la literatura tcnica est muy extendida la utilizacin de la distribucin de Weibull biparamtrica
(, ), debido a que, el tercer parmetro es el parmetro de localizacin y se hace = 0, es decir, el
parmetro que localiza la abscisa a partir del cual se inicia la distribucin. Trabajando de forma
biparamtrica se ha de asumir el error de falta de localizacin.
Las funciones principales de esta distribucin serian indicadas a continuacin:
La FuncindeDensidadf(t) de una variable aleatoria continua Testara indicada por:
1 t
t
f t e t0
siendo
= parmetro de origen (slo se considera t ).
= parmetro de forma.
= 1/ = parmetro de escala o caracterstica de vida.
y su representacin grfica se muestra en la figura 24 para = 0, = 0.5, 1, 1.5, 2.5 y 3.44 y
=1.
Figura24.FuncindeDensidaddeunaWeibull.
II.25
CaptuloII.FundamentosTericos
y su representacin grfica se indica en la figura 25. Siendo esta una funcin creciente y
tiende a 1 cuando t .
Figura25.FuncindeDistribucindeunaWeibull.
Figura26.FuncionesdeFiabilidaddeunaWeibull.
II.26
CaptuloII.FundamentosTericos
1
f t t
ht t0
R t
Figura27.FuncindeRiesgooTasadeFallodeunaWeibull.
Si consideramos que = 0 (es decir, hay posibilidad de fallo desde t = 0), y para el valor
particular = 1, presenta tasas de fallos crecientes, decrecientes o constantes:
0 < < 1. La funcin de riesgo es decreciente, es decir, la tasa de fallo disminuye
al aumentar el tiempo (perodo infantil).
= 1. La funcin de riesgo es constante e igual a 1/, por lo que no depende del
tiempo. La distribucin, en ausencia de parmetro de origen, es exactamente la
exponencial de media .
> 1. La funcin de riesgo es creciente, describiendo bien el perodo de
desgaste.,
o 0 < 4. Perodo de desgaste tempranos,
1 < < 2. La funcin de riesgo crece rpidamente en el origen y
muy poco a medida que t crece. Fallos en piezas mecnicas
(rodamientos).
= 2 el riesgo crece linealmente con el tiempo. La distribucin
Weibull se aproxima a distribucin de Rayleigh.
2 < < 4. Crece poco con t prximo a cero y despus rpidamente.
Fatiga de piezas de baja frecuencia ( = 2.5 a 4). Fallos en correas
( = 2.5).Fallos por corrosin y erosin ( = 3 a 4). Para = 3.44, la
distribucin Weibull se aproxima a distribucin Normal.
II.27
CaptuloII.FundamentosTericos
Figura28.FuncindeRiesgoAcumuladodeunaWeibull.
1
E T 1
1 1
Donde 1 es la funcin Gamma x , para x 1
La VarianzaVar[T] seria:
2
2
1 2
Var T 1 1
II.28
CaptuloII.FundamentosTericos
II.29
CaptuloII.FundamentosTericos
Figura29.FuncindeDensidaddeunaGamma.
Figura30.FuncindeDistribucindeunaGamma.
II.30
CaptuloII.FundamentosTericos
Figura31.FuncionesdeFiabilidaddeunaGamma.
II.31
CaptuloII.FundamentosTericos
Figura32.FuncindeRiesgooTasadeFallodeunaGamma.
Figura33.FuncindeRiesgoAcumuladodeunaGamma.
La MediaoEsperanzaMatemtica=E[T] seria:
E T
La VarianzaVar[T] seria:
Var T 2
II.32
CaptuloII.FundamentosTericos
Figura34.FuncindeDensidaddeunaErlang.
Figura35.FuncindeDistribucindeunaErlang.
II.33
CaptuloII.FundamentosTericos
Figura36.FuncionesdeFiabilidaddeunaErlang.
Figura37.FuncindeRiesgooTasadeFallodeunaErlang.
II.34
CaptuloII.FundamentosTericos
Figura38.FuncindeRiesgoAcumuladodeunaErlang.
2.2.4. Mantenibilidad
La mantenibilidad es una medida importante de la confiabilidad para todos los tipos de sistemas
reparables y refleja la capacidad del sistema para ser mantenido en, o devuelto a, un estado en el que
pueda realizar la funcin requerida. Como ejemplos, se pueden citar las actualizaciones a mitad de
vida de los proyectos software para corregir niveles bajos de la disponibilidad obtenida o sistemas
remotos que son difciles de mantener. Adems, para otros sistemas, la mantenibilidad, si se
especifica incorrectamente, puede tener un efecto significativo en la confiabilidad conseguida,
especialmente en sistemas sin redundancias. Un tratamiento general de la mantenibilidad se muestra
en la Norma IEC 60300-3-10.
Una medida de la mantenibilidad es el MTTR (Mean Time To Repair) o como se conoce en
castellano Tiempo Medio de Reparacin. En la Figura 4 se present su ecuacin y la representacin
de los distintos TTR que componen el MTTR.
Se dir que un sistema es Altamente mantenible cuando el esfuerzo asociado a la restitucin sea
bajo. Sistemas poco mantenibles o de Baja mantenibilidad requieren de grandes esfuerzos para
sostenerse o restituirse.
II.35
CaptuloII.FundamentosTericos
Esta funcin sera similar a la funcin de supervivencia evaluada a travs de los tiempos de
fallo pero ambas funciones se presentan con connotaciones opuestas. Rr(t) se define como
la probabilidad de que el sistema no haya sido reparado previamente, mientras que en
supervivencia se define como la probabilidad de no haber fallado antes de un tiempo t.
Con lo cual, el crecimiento de Rr(t) conlleva implicaciones negativas en cuanto a la
disponibilidad del sistema, mientras que el crecimiento de R(t) sucede lo opuesto.
Funcin de densidad del tiempo de reparacin, es una funcin de densidad de probabilidad
y se expresa como:
dM t
m t
dt
Esta funcin tiene similares propiedades que la funcin de densidad del tiempo de fallos.
Por tanto, permite el clculo de la probabilidad de que una reparacin dure en un cierto
intervalo de tiempo mayor o menor que un tiempo fijado.
Tasa de reparacin en el instante t, mide la probabilidad que un sistema sea reparado en
el intervalo [t, t + t]. Conocer este parmetro resulta muy til en mantenimiento, ya que
su evolucin determina la probabilidad de que la reparacin sea completada en un instante
dado.
La Tasa de Reparacin (t) estara definida mediante:
m t
t
1 M t
II.36
CaptuloII.FundamentosTericos
t
DMT90 t M t P DMT t m t dt 0.9
0
Figura39.MedidasdeMantenibilidad
II.37
CaptuloII.FundamentosTericos
de vida de stos. Las pruebas pueden continuar hasta que todos los elementos de la muestra hayan
fallado, o bien se pueden interrumpir, en este ltimo caso se dira que el conjunto de datos obtenidos
ha sido censurado.
Una vez que se dispone de los tiempos de fallos observados se convierten en el conjunto de datos
al que se aplican mtodos estadsticos para obtener estimaciones de fiabilidad mediante el ajuste de
algn modelo estadstico. Si no se ha logrado identificar la distribucin de los tiempos de fallo, se
optar por un enfoque no paramtrico. Si, por el contrario, las observaciones se ajustan a alguna de
las distribuciones tericas conocidas, se optar por usar mtodos paramtricos.
Los mtodosnoparamtricostienden a ser ms sencillos. Estos mtodos son menos eficientes que
los mtodos paramtricos, pero resultan de gran utilidad cuando no se conoce ningn modelo
paramtrico que se ajuste adecuadamente a los datos, se basa en la filosofa que algunos autores han
llamado dejar que los datos decidan por s mismos. Estos proporcionan estimaciones puntuales de
R(t), f(t) y h(t) a partir de las observaciones obtenidas (sin poder suponer que stas siguen una
determinada distribucin terica). Este tipo de estudios, de gran aplicacin en el contexto del anlisis
de supervivencia, no es de uso tan frecuente en el campo de la ingeniera de estimacin de vida til o
tiempos de fallo
Los mtodosparamtricos son los ms extendidos y las estimaciones que se obtienen apoyan unos
anlisis posteriores ms detallados. Con mucha frecuencia, se han empleado para estimar funciones
de fiabilidad y realizar contrastes de hiptesis sobre las mismas. En general estos modelos son usados
en el anlisis del tiempo de vida y en problemas relacionados con la modelizacin del envejecimiento
y el proceso de fallo. El uso de mtodos paramtricos requiere la eleccin de un estadstico de
contraste adecuado. La utilizacin de ciertos estadsticos de contraste exige el cumplimiento de
determinados requisitos, referidos a los parmetros y a la distribucin poblacional. Estos requisitos
son los denominados supuestos paramtricos, entre los que se suelen encontrar los siguientes:
Las variables consideradas son cuantitativas continuas, medidas por lo menos en una
escala de intervalos.
Las muestras consideradas proceden de poblaciones en las que las variables se distribuyen
segn la ley normal. Si la distribucin de la muestra se logra aproximar a alguna
distribucin terica conocida, ser posible usar la distribucin terica para proporcionar
estimaciones de las funciones R(t), f(t) y h(t).
Se da homoscedasticidad (homogeneidad de varianzas) entre las distintas distribuciones
comparadas, es decir, las muestras proceden de poblaciones con varianzas similares.
Las muestras consideradas tienen un tamao grande. Consideraremos grande, una
muestra de tamao superior a 30 individuos (n>30).
II.38
CaptuloII.FundamentosTericos
La significacin de los resultados que obtengamos depender del cumplimiento efectivo de tales
condiciones.
Siempre que se cumplan los supuestos exigidos, las pruebas paramtricas resultan de mayor
potencia que las no paramtricas, esto es, la probabilidad de rechazar una hiptesis nula
efectivamente falsa es mayor. Teniendo esto en cuenta, el criterio que se ha de seguir de seguir a la
hora de elegir entre pruebas paramtricas o no paramtricas es el de aplicar una del primer tipo
siempre que las condiciones exigidas para ello se cumplan. Pero si no se cumplen tales condiciones, y
especialmente si el tamao muestral es muy pequeo, es preferible recurrir a las pruebas no
paramtricas.
2.3.1.1. Censura
Normalmente, los datos asociados a tiempos de vida presentan observaciones incompletas. La
estimacin de las caractersticas de la fiabilidad cambian respecto a la estimacin clsica de muestras
completas. Un fenmeno que produce datos incompletos es la censura.
Formalmente, se dice que una observacin es censurada por la derecha de un valor C si el valor
exacto de tal observacin no es conocida pero s se sabe que excede del tiempo C. Anlogamente, una
observacin es censurada por la izquierda de C cuando slo se sabe que el valor de la observacin es
menor que C. Tambin puede aparecer la censura por intervalo, donde los datos censurados
presentan censura por la derecha y por la izquierda. Es ms comn que aparezca la censura por la
derecha que por la izquierda con datos asociados a tiempos de vida. Para poder hablar de censura se
tendr que tener en cuenta la forma en cmo se obtuvieron los datos. El problema fundamental es
II.39
CaptuloII.FundamentosTericos
1 si ti C
i
0 si ti C
donde los datos observados contribuyen en la expresin anterior con su funcin de densidad y los
datos censurados con su funcin de fiabilidad. Por lo tanto, la funcin de verosimilitud en el caso de
censura tipo I seria:
II.40
CaptuloII.FundamentosTericos
n n
i 1i i 1i
f T
i 1
i R Ci f Z
i 1
i R Zi
Cuando las unidades de estudio tienen diferentes tiempos de censura, fijados previamente, esta
forma de censura es llamada: Censura TipoIprogresiva. Este tipo de censura se puede representar
mediante el siguiente ejemplo que presenta dos diferentes tiempos de censura.
Suponga que se tienen 20 unidades en un experimento donde el evento de inters es la muerte.
Suponga que se han marcado 10 de color rojo y los restantes 10 de color azul, de manera que se ha
determinado a cada grupo de unidades, tiempos de censura de 42 y 104 semanas respectivamente.
De modo que las unidades con marca roja que sobrevivan 42 semanas sern sacrificadas, as como las
marcadas de color azul que lleguen vivas a las 104 semanas.
Una forma de ampliar la perspectiva de la Censura Tipo I es cuando las unidades entran al estudio
a diferentes tiempos, y el punto terminal de estudio predeterminado por el investigador es el mismo
para todas. En este caso, el tiempo de censura para cada unidad es conocido en el momento en que
entra al estudio, de manera que cada unidad tiene fijo y especificado su propio tiempo de censura.
Este tipo de censura ha sido denominado Censura de Tipo I generalizada. Este tipo de censura es
ilustrado en la figura 40 para 4 unidades, donde t1 = X1.- Tiempo de fallo para la primera unidad (1 =
1). t2 = Cr2.- Tiempo censurado por la derecha para la segunda unidad (2 = 0). t3 = X3.- Tiempo de fallo
para la tercera unidad (3 = 1). t4 = Cr4.- Tiempo censurado por la derecha para la cuarta unidad (4 =
1).
Figura40.CensuradeTipoIGeneralizada
II.41
CaptuloII.FundamentosTericos
Figura41.CensuradeTipoIGeneralizadapara4unidadesRe-escaladasalTiempoCero.
Figura42.DiagramadeLexisparalaCensuradeTipoIGeneralizada.
II.42
CaptuloII.FundamentosTericos
n r !
f t1 f t r R t r
II.43
CaptuloII.FundamentosTericos
unidades removidas intencionalmente), los Ktiempos de censura sern las variable aleatoria T. tr1, tni
+r2, tn1+n2+r3, . . . , tn1+n2+ . . . + nk-1+ rk.
La Censura tipo II progresiva puede ser representada mediante el siguiente ejemplo. Suponga que
se tienen 100 unidades en un experimento donde el evento de inters es la muerte. Se definen 3
tiempos de fallo distintos. El primer tiempo de fallo se dar cuando mueran 15 unidades, en ese
momento, se retiraran del estudio 15 unidades de las 85 vivas, continuando en el estudio 70 unidades.
El segundo tiempo de fallo se dar cuando mueran 20 unidades de las 70 en estudio, en ese momento,
se retirarn 10 unidades de las 50 vivas, quedando 40 unidades en estudio. El tercer tiempo de fallo
quedara determinado cuando mueran 30 unidades de las 40 en estudio y se sacrificarn en ese
momento las 10 unidades supervivientes. De este modo, en el primer tiempo de fallo se obtendrn
15 eventos y 15 censuras, en el segundo tiempo de fallo se obtendrn 20 eventos y 10 censuras, y en
el tercer tiempo de fallo se obtendrn 30 eventos y 10 censuras.
1 si ti C
i
0 si ti C
Los datos de las observaciones sobre n individuos vendrn dados por los pares (Zi, i),i= 1, . . . ,n.
Entonces, la contribucin del par (Zi, i) a la funcin de verosimilitud seria:
i 1i
f Zi S Zi g Zi R Zi
II.44
CaptuloII.FundamentosTericos
donde un dato censurado contribuye con su funcin de densidad y la funcin de fiabilidad del dato
no censurado y un dato observado contribuye con su funcin de densidad y la funcin de fiabilidad de
la censura. En este caso, la funcin de verosimilitud seria:
n
i 1i
f Z S Z
i 1
i i g Zi R Zi
2.3.1.2. Truncamiento
Una segunda caracterstica que puede presentarse en algunos estudios de vida o supervivencia,
son los datos truncados.
El truncamiento es definido como una condicin que presentan ciertas unidades en el estudio y el
investigador no puede considerar su existencia. Cuando los datos presentan truncamiento, solamente
II.45
CaptuloII.FundamentosTericos
a las unidades a las que les ocurre algn evento particular, antes del evento de inters o la censura,
son consideradas en el anlisis por el investigador.
II.46
CaptuloII.FundamentosTericos
II.47
CaptuloII.FundamentosTericos
La validez de este ajuste, en cierta medida arbitraria, depende de las caractersticas de los
procesos de censura y de fallo. Bajo el esquema de censura aleatoria, este estimador seria
inconsistente y sesgado. Sin embargo, cuando la proporcin de censura no es excesiva y
se distribuye de forma homognea, si los intervalos no son muy amplios y los valores de ni
no son demasiado pequeos, el comportamiento de este estimador es aceptable.
qi: proporcin de supervivencia en el intervalo i-simo. Este valor estima la probabilidad
de que un individuo sobreviva al instante ti:, dado que estaba vivo al inicio del intervalo i-
simo. Se define:
qi 1 pi
II.48
CaptuloII.FundamentosTericos
P(T > ti) Si un individuo sobrevive hasta el inicio del intervalo (i + 1) -simo, implica que
dado que ha sobrevivido hasta el comienzo del intervalo i-simo, no falla durante el
intervalo i-simo; as:
P ti Ri qi P ti 1
P ti Ri qi qi 1 q1
P ti 1 P ti
f ti
bi
f ti f ti
h ti
P ti Ri
PrecisindelasEstimaciones.
Los valores de qi, pi y P ti Ri son estimaciones sujetas a la variabilidad inherente al proceso de
muestreo, por lo que deben completarse con informacin relativa a su precisin. Bajo determinadas
hiptesis sobre los mecanismos de censura es posible, aunque complicado, deducir estimaciones de
sus varianzas. Por esta razn, aunque la metodologa de las tablas de vida clnicas es antigua, el estudio
terico de las propiedades estadsticas de sus estimadores es reciente y est an por completar. En
este apartado se presentan algunas de las propiedades y resultados ms utilizados. La mayor parte de
estos resultados se han obtenido para el caso de muestras completas, pero se suelen generalizar y
aplicar tambin al caso de muestras censuradas.
La estimacin ms empleada de la varianza de P t j R j seria la propuesta por Greenwood:
II.49
CaptuloII.FundamentosTericos
j pt 2 j dt
Var R j R 2j Rj t t t
t 1 q n t 1 n n d
t t
Esta estimacin, resultado de una aproximacin asinttica es razonable cuando el valor esperado
de nj no es demasiado pequeo y requiere, si la proporcin de censura en la muestra es importante,
que el nmero de intervalos considerados no sea muy pequeo. La expresin anterior tiende a
subestimar la varianza de P t j , especialmente en los intervalos de la cola derecha de la distribucin
donde el valor esperado de nj suele ser pequeo. No obstante en esos casos su clculo no es adecuado
ya que la distribucin de P t j suele ser muy sesgada y, en consecuencia, la varianza no es una buena
II.50
CaptuloII.FundamentosTericos
R t Z
1
ee R t
2
donde Z
es el cuantil correspondiente a la distribucin normal estndar y ee
1
2
R t
Var R t es el error estndar de estimacin del estimador KM de R(t), que se calcula con
la anterior frmula de Greewood.
intervalo de confianza para este valor transformado. El resultado induce un intervalo de confianza
para R(t).
Este intervalo de confianza para el verdadero valor del logaritmo de la funcin de supervivencia al
tiempo t, es obtenido con el supuesto de que sigue una distribucin asinttica normal con media
k dj
log(R(t)) y varianza estimada por es una aproximaci0n de la distribucin de logR t . Por
j 1 n
j n j d j
tanto, un intervalo de un 100(1 - ) % de confianza para log(S(t)), para un valor especfico de t est
dado por:
1
log R t z s.e. log R t , log R t z s.e. log R t
1
2 2
donde
II.51
CaptuloII.FundamentosTericos
1
k dj 2
s.e. log R t
j 1 n
j nj d j
donde z1-/2 es el cuantil que acumula 1 - /2 de probabilidad en una distribucin normal estndar
Una banda de confianza para el verdadero valor de R(t) de un 100(1 - ) % de confianza para un
valor especifico de test dado por
R t exp z s.e. log R t , R t exp z s.e. log R t
1 1
2 2
Este intervalo es una forma de crear una banda de confianza para la funcin acumulativa de riesgo
H (t) puesto que H (t) = log(R(t)).
log(R(t))), y obtener un intervalo de confianza para este valor transformado. El resultado induce un
intervalo de confianza para R(t).
Este intervalo de confianza para el verdadero valor del log(-log(R(t))) al tiempo t, es obtenido con
el supuesto de que una distribucin asinttica normal con media log(-log(R(t))) y desviacin estndar
t
estimada por la expresin de s.e log logR es una aproximacin de la distribucin de
log logR t . Por tanto, un intervalo de un 100(1 - ) % de confianza para log(-log(R(t))), para un
1 k dj
2
s.e. log log R t
log R t
j 1 n
j nj d j
y z1-/2 es el cuantil que acumula 1 - /2 de probabilidad en una distribucin normal estndar
Este intervalo induce una banda de confianza para el verdadero valor de SR(t) de un 100(1 - ) %
de confianza para un valor especifico de test dado por
1 2
R t exp z s.e. log log R t
, R t exp z
1
s.e. log log R t
2
II.52
CaptuloII.FundamentosTericos
II.53
CaptuloII.FundamentosTericos
supervivencia del paciente despus del trasplante. La tasa de censura de la base de datos de Stanford
era del 27%.
El mtodo de KMp propuesto, responde a esta situacin y considera la censura como una parte
importe del anlisis, que se involucra directamente en la frmula de su factor de ponderacin Wj,
conocido como tasa de no censura y que est definido por:
nj c j
wj con 0 w j 1
nj
De modo que si Wj = 1, no hay censura en el instante tj (pues Cj = 0), pero si Wj < 1 , en el instante
tj hay al menos una censura.
El estimador KMp, se define entonces como:
1 si t 0
nj d j
R t
j:t j t n j
0 si t 0
En este caso las estimaciones KM p R t estaran definidas para todo t 0, alcanzando el valor 0,
an en el caso de que la ltima estimacin sea censurada, se sugiere considerar la ltima observacin
censurada como un fallo, para garantizar su definicin en todo instante. Si no hay censura, R t
coincide con la funcin emprica de supervivencia FES, ya que Wj = 1 y R t coincidira con KM, que a
FuncinempricadeFiabilidad(FES)
Si se tienen n tiempos de fallo ordenados, t1 t2 . . . tn, donde no hay censura, el nmero de
unidades que sobreviven el instante tj es n - i.
Por lo tanto, una plausible estimacin no paramtrica de la funcin de fiabilidad R(t) en tj, sera
simplemente la proporcin de unidades que sobreviven en el instante tj:
ni
R ti i 1 ,2 , ,n
n
En consecuencia habra una probabilidad cero de sobrevivir ms all de tn. Como es improbable
que ningn valor muestral alcance el tiempo hasta el fallo ms alto, esta expresin tiende a subestimar
la fiabilidad de la componente. En una muestra de datos sin censura, el estimador KM coincide con
este estimador, usualmente conocido como funcin emprica de supervivencia o fiabilidad (FES)
II.54
CaptuloII.FundamentosTericos
Donde R t es el estimador KM de la funcin R(t). Otro posible estimador de esta misma funcin
H(t) = (t), definido por Nelson (NA), es la funcin emprica de riesgo acumulado:
dj
t t
H n
j ,t j t j
Este estimador ha sido tema de discusin (para el caso de una variable continua) por parte de
diferentes autores. La conclusin es que, en el caso de que T sea una variable aleatoria continua, H t
estimaciones son ms inestables, la diferencia entre ambos ser, por general pequea. En la prctica
t es una aproximacin lineal de primer orden de la funcin H t . Aunque t es ms sencillo de
II.55
CaptuloII.FundamentosTericos
II.56
CaptuloII.FundamentosTericos
n 1Yi t , i 1 n
1 di
S t n 1 r
i 1
1
j 1 X j Yi Yj
i 1 i
yi independientemente de las observaciones que haya despus, es decir aunque estemos observando
supervivencias y fallos despus de este punto. Claramente esta situacin no es satisfactoria y es un
problema exclusivamente introducido por el caso de truncamiento, que puede inducir pocos casos de
individuos en riesgo en la cola de la izquierda.
II.57
CaptuloII.FundamentosTericos
Y esta misma expresin es la que se utiliza para estimar la funcin de supervivencia o de fiabilidad
a travs del estimador:
Re t S e t e H e t
II.58
CaptuloII.FundamentosTericos
riesgo respectivamente en las r poblaciones en el instante ti(i = 1, ...,k). De modo que, para la j-sima
poblacin el estadstico zj(t) queda bien definido por la suma ponderada:
k d
z j t i 1
w ti dij nij i j 1 , ,r
ni
Que corresponde a las diferencias entre el nmero observado de sucesos y su nmero esperado,
bajo la hiptesis nula en la muestra j-sima; donde la funcin peso w(ti) que aparece en zj(t) es
II.59
CaptuloII.FundamentosTericos
compartida por todos los r grupos y es la que regula la potencia de los distintos contrastes
anteriormente mencionados (Log Rank, Breslow, etc.)
Las zj(t), as definidas son la base del estadstico de contraste de las hiptesis anteriormente
referenciadas y que viene dado por la forma cuadrtica:
2 z1 t , ,zr 1 t 1 z1 t , ,zr 1 t
1
Donde es la matriz inversa de varianzas-covarianzas de las componentes seleccionadas. Si la
hiptesis nula es cierta, este estadstico debe seguir una distribucin ji-cuadrado con r - 1 grados de
libertad.
II.60
CaptuloII.FundamentosTericos
que se basan en la estimacin de la funcin de distribucin. Si los datos son completos, la funcin de
distribucin de probabilidad se estima de forma inmediata. Si son censurados, se usaran los grficos
de riesgo como la alternativa a los grficos de probabilidad cuando los datos estn censurados.
II.61
CaptuloII.FundamentosTericos
Representacin de los datos en el papel de probabilidad del modelo terico hasta que
formen una lnea recta, en caso contrario, volver al punto 2 y utilizar otra distribucin.
Estimacin de los parmetros del modelo a partir del grfico
II.62
CaptuloII.FundamentosTericos
Se puede por tanto expresar la ecuacin anterior como y = x - ln(). Por tanto, se concluye
que lnln[1/(1-F(t))] es una funcin lineal de ln(t), el parmetro de forma, , es la pendiente de la
recta y el parmetro de escala , est en funcin de la interseccin de la recta para t= 0 y del
parmetro de forma , por lo tanto:
x
tan g
y
El grfico probabilstico de Weibull se basa en esta relacin lineal y una manera fcil de comprobar
si unos datos se ajustan al modelo de Weibull es hacer el grfico lnln[1/(1 - F(t))] versus ln(t), donde t
son los datos ordenados y R(t) = 1 - F(t) es la funcin de fiabilidad emprica, y evala hasta qu punto
la relacin lineal es factible.
PlantillaespecialparagrficodeprobabilidaddeWeibull
En el caso de una distribucin Weibull biparamtrica (, ), se vio que las transformaciones a aplicar
serian:
y = ln(ln(1-F(t))-1) y x = ln(t)
II.63
CaptuloII.FundamentosTericos
Figura43.PlantillaparaGrficodeProbabilidadWeibull
probabilidad. Cada uno de los puntos ti ,F ti , i = 1,2,..., n, representar a cada uno de los n tiempos
de fallo observados, ti (eje x) , junto con el correspondiente valor estimado de la f.d. experimental,
F ti (eje y). El diagrama de probabilidad permitir apreciar visualmente si la nube de puntos sigue
un patrn aproximadamente lineal (lo cual favorecera la hiptesis de que la distribucin terica
seleccionada se ajusta bien a las observaciones) o, por el contrario, si sta sigue un patrn muy distinto
del lineal (lo cual permitira descartar la distribucin terica seleccionada a efectos de explicar el
comportamiento de las observaciones). A continuacin se explica un mtodo (no es el nico, aunque
s uno de los ms utilizados) que permite obtener estimaciones puntuales de la f.d. emprica, F ti , a
II.64
CaptuloII.FundamentosTericos
EstimacinPuntual(noparamtrica)delaf.d.emprica F ti
Sean t1. t2 t3. . . tn son los n tiempos de fallo observados ordenados de menor a mayor. Para cada
punto (xi, yi) con i = 1,2,..., n , el valor xi vendr dado por la i-sima observacin ti (instante en que se
ha producido el fallo i-simo). Para estimar el valor de la coordenada yi, la cual representar el valor
estimado de F ti , existe cierta dificultad respecto a la forma adecuada para su estimacin, frente a
ello han surgido diferentes propuestas, todas ellas requieren del ordenamiento creciente previo de
los datos de falla y la asignacin de su respectiva posicin i+ dentro de este ordenamiento.
donde:
i = nmero de orden de observacin
n = nmero total de observaciones
Algunos autores [ZZ] indican la propuesta ms acertada para el valor estimado f.d. emprica, F ti
II.65
CaptuloII.FundamentosTericos
Cuando se tengan ya representados todos los puntos (xi, yi) asociados a las observaciones, se
deber determinar visualmente una recta de manera que las desviaciones entre los datos y la recta
sean lo menores posible y decidir si el ajuste es suficiente, la cual corresponder a la f.d. de la
distribucin elegida cuyos valores de los parmetros mejor se ajusten grficamente a las
observaciones.
Figura44.ComparacinGrficaentreDistribuciones
II.66
CaptuloII.FundamentosTericos
La funcin de riesgo acumulada, al igual que la funcin de riesgo, no es una probabilidad. Sin
embargo, tambin es una medida del riesgo: cuanto mayor es el valor de H(t), mayor es el riesgo de
fallo en el tiempo t.
5. Para cada tiempo de fallo observado dibujar el valor transformado de (ti) (i.e. Weibull: ln(ti)) en
el eje de abscisas y el valor transformado de Hn(i) (i.e. Weibull: ln(Hn(i))) en el eje de ordenadas. Los
datos censurados no aparecen en el grfico.
6. Determinar una recta de manera que las desviaciones entre los datos y la recta sean lo menores
posible y decidir si el ajuste es suficiente, la cual corresponder a la funcin de riesgo de la distribucin
elegida.
7. Estimar los parmetros grficamente a partir de la expresin linealizada. (i.e. Weibull: ln(H(t)) =
ln(t) - ln())
II.67
CaptuloII.FundamentosTericos
rango ti
F T i
n
i 1 , ,r
H T i ln 1 F t i i 1 , ,r
Esta funcin representa el porcentaje emprico de fallos ocurridos ante el tiempo de fallo
correspondiente al rango i-simo, por lo que la tasa de fallo acumulada en la muestra ordenada
ser:
ni
H Ti ln
n
i 1 , ,r
lnt , lnH t
i i i 1 , ,n i 1 , ,r
II.68
CaptuloII.FundamentosTericos
y las estimaciones de los parmetros serian a ,con lo que la estimacin del parmetro de
estimaciones de a y b, que notamos por a y b , aquellos valores que hagan mnima la suma de los
errores al cuadrado, que viene dada por:
n n
2
SSE i2 yi a bxi
i 1 i 1
II.69
CaptuloII.FundamentosTericos
La solucin se obtiene por el mecanismo habitual, derivando SSE con respecto a a y b e igualando
a 0. Los estimadores resultantes serian:
SSxy
b
SSxx
a y bx
Siendo:
n n
SSxy x x y y x y nxy
i 1
i i
i 1
i i
n n
2 2
SSxx xi x x i nx 2
i 1 i 1
1
La pendiente de la lnea producida por yi ln y xi ti representan una estimacin de
1 F ti
.
Realizando el mtodo de mnimos cuadrados en la forma que y = b x, es posible expresar la f.d.
anterior como y = (1/) x, obteniendo:
n
1 x2
i 1 i
n
b
xy
i 1 i i
II.70
CaptuloII.FundamentosTericos
donde F ti es el valor estimado f.d. emprica indicado en la seccin 2.3.3.1.3 y xi lnti . Por tanto:
n
b
xi x yi y
i 1
n 2
i 1 xi x
y
a ln y bx
La funcin de verosimilitud L() se puede interpretar como una medida de lo probable que son las
observaciones registradas bajo el supuesto de que stas provienen de la distribucin terica
especificada. As, los valores de para los cuales L() es relativamente grande sern ms probables
que los valores de para los cuales la probabilidad de las observaciones es relativamente pequea.
Se tratar pues de hallar (si existe) un estimador de mxima verosimilitud, i.e., un valor del
parmetro que maximice la funcin L().
II.71
CaptuloII.FundamentosTericos
l
0 i 1,,k
i
donde i es la i-sima componente del vector de parmetros = (1,... ,k)'.
t
i 1
i
n
n
siendo t el tiempo total de funcionamiento acumulado para las n observaciones.
i 1
i
II.72
CaptuloII.FundamentosTericos
lnL n n 1 n
lnti
i 1 t
i 1
i lnti 0
n
lnL n 1
2
t
i 1
i 0
mtodos iterativos numricos como el mtodo de Newton-Raphson. Una vez estimado el parmetro
2
t
i 1
i 0
II.73
CaptuloII.FundamentosTericos
n r !
f t1 f tr R tr
t n r t
i 1
i r
r
El estimador de mxima verosimilitud para de forma genrica seria:
L
r
siendo r el nmero tiempos de vida (fallos) observados en el test y L el tiempo total de
funcionamiento acumulado, el cual vendr dado para los diferentes tipos de censura por:
II.74
CaptuloII.FundamentosTericos
siendo tr una variable aleatoria que representa el instante en que falla la r -sima
observacin
n r !
f t1 f tr R tr
II.75
CaptuloII.FundamentosTericos
r
t lnt n r t ln t
i i r r
1 1 r
i 1
r
lnt 0
r i 1 i
ti n r Tr
i 1
y utilizando esta ltima, se obtiene que el estimador de mxima verosimilitud del parmetro escala
ser:
1
r
t n r tr
i 1 i
r
Es necesario utilizar mtodos iterativos como el Newton-Raphson para obtener las anteriores
estimaciones.
El estimador de mxima verosimilitud para de forma genrica seria:
1
L
r
1 n
n i 1
ti
t.f t ;1 , 2 dt
1 n 2
ti t 2 .f t ;1 , 2 dt
n i 1
Por tanto genricamente un estimador insesgado y estable para el momento al origen kth seria:
n
k
t
i 1
i
mk
n
II.76
CaptuloII.FundamentosTericos
t
i 1
i
n
lo cual es lo mismo que el estimador de mxima verosimilitud indicado anteriormente.
2 1
1 2 1
k2
k2
1
2 1
Realizando la raz cuadrada, se obtiene el coeficiente de variacin CV:
II.77
CaptuloII.FundamentosTericos
2 1
1 2 1
CV
1
1
A continuacin se realizara una tabla para varios CV usando la expresin de CV para diferentes
valores de . Para la estimacin de y , es necesario calcular el coeficiente de variacin (CV)d de los
datos de la muestra. Una vez hecho esto, se compara el (CV)d con el CV utilizando la tabla. El
E t
2
2
2
II.78
CaptuloII.FundamentosTericos
t n r t
i 1
i r
r
2
1
E t 1
1 1
2 1
se resuelven simultneamente para y . Para hacer esto, los momentos de la muestra basados
en los datos se utilizan en el lado izquierdo de las ecuaciones, y el valor t(r)+E[t+] se utiliza para los
puntos de datos censurados. La sustitucin dara la expresin:
2
1
E t 1
1 1
2 1
se utiliza para que las ecuaciones se expresen en funcin de las dos estimaciones desconocidas y
de los valores de los datos conocidos. El proceso de esta estimacin es simple. El lado izquierdo de la
II.79
CaptuloII.FundamentosTericos
II.80
CaptuloII.FundamentosTericos
EstimacindeIntervaloparalaDistribucinExponencial
Se supone que t1,t2,...,tn es una muestra aleatoria de una distribucin exponencial de parmetro
, ti ~ (1/). Se conoce que E(ti) = , luego la media muestral ti/n es un estimador insesgado y
consistente de . Para obtener un intervalo de confianza para es necesario recordar que la suma de
variable aleatoria exponenciales independientes es una variable aleatoria con distribucin Gamma, es
decir:
n
1
t n,
i 1
i
1 1
Adems si V , y a > 0 entonces aV , . Luego:
a
n
2
t 2
i 1
i 2n
n
2
La funcin
i
2
t depende del parmetro de inters y cuya distribucin es conocida como 2n
i 1
(i.e., es aquel valor que, en una 2 con g grados de libertad, deja a su izquierda un rea p)
II.81
CaptuloII.FundamentosTericos
n
2
P 2 t i
2
1
2r ,
2
i 1
2 r ,1
2
Equivalente a:
n n
2
i 1
t i 2 ti
2 i 21 1
2r ,1
2r ,
2 2
con lo que el intervalo buscado para , a un nivel de confianza (1 )%, viene dado por:
n n
2 ti 2 t i
i 1
2 , i 21
2 r ,1 2 r ,
2 2
El intervalo anterior es una generalizacin del visto para el caso de observaciones completas. Ello
no es de extraar si se tiene en cuenta que las observaciones completas se pueden interpretar como
un caso particular de observaciones censuradas de tipo II (en concreto, cuando n=r).
II.82
CaptuloII.FundamentosTericos
que es una matriz cuadrada con dimensiones k x k. Cada elemento de la matriz es el opuesto de la
segunda derivada parcial de la funcin de log-verosimilitud evaluada posteriormente en los
estimadores de mxima verosimilitud del modelo de distribucin correspondiente. La inversa de la
EstimacindeIntervaloparaladistribucinWeibull
Basndose en la teora general del mtodo de mxima verosimilitud, se puede suponer que T es
una variable aleatoria con distribucin Weibull (, ) y que los estimadores de mxima verosimilitud
n
t
i 1
i
n
Entonces se pueden estimar las caractersticas de fiabilidad y los intervalos de confianza.
Una caracterstica de los estimadores de mxima verosimilitud es que son asintticamente
normales, es decir, que s y son los estimadores de mxima verosimilitud de los parmetros
N , Var
N , Var
donde Var y Var
son los elementos diagonales de la matriz inversa de la matriz de
informacin de Fisher evaluada en y . Por tanto, las cantidades anteriores estandarizadas serian:
II.83
CaptuloII.FundamentosTericos
N 0 ,1 N 0 ,1
Var
Var
z Var , z Var z
Var , z
Var
2 2 2 2
Var son las races cuadradas de las estimaciones de los elementos diagonales de la matriz de
varianzas-covarianzas.
1
2l
Var
II.84
CaptuloII.FundamentosTericos
donde
t1-/2,n-2 = t-Student con n-2 grados de libertad que deja a su izquierda un rea de 1 - /2.
sR =Varianza residual del modelo.
SXX = nX2
II.85
CaptuloII.FundamentosTericos
II.86
CaptuloII.FundamentosTericos
o Test 2 de Pearson.
o Test G.
Muestras no categorizadas (distribuciones continuas).
o Test Kolmogorov-Smirnov (test K-S).
o Test de Cramr-von Misses
o Test de Anderson-Darling
o Coeficiente de determinacin R2
o Test de normalidad Shapiro-Wilk.
2
n
Oi Ei 2
i 1 Ei
donde:
Oi = Frecuencia observada de la muestra
II.87
CaptuloII.FundamentosTericos
Cuanto mayor sea el valor de 2 , menos verosmil es que la hiptesis sea correcta. De la misma
Finalmente, con el valor de 2 se verifica que sea menor o igual al valor obtenido de las
esperados y observados con la hiptesis nula de que nuestra distribucin de datos se ajusta a una
distribucin ya conocida. Adems, los grados de libertad se calculan del mismo modo y el valor de
contraste del test se obtiene a partir de la tabla 2 .Se recomienda la utilizacin del test G cuando las
diferencias entre frecuencias observadas y esperadas son superiores a las frecuencias esperadas y, al
Del mismo modo que en el test anterior, se busca en la tabla 2 el valor crtico con los v y el nivel
de significacin determinados y si 2 critico es mayor que G se acepta la hiptesis nula de que los
Debido a que el ajuste a una distribucin 2 del estadstico G no es exacto, el valor obtenido se
II.88
CaptuloII.FundamentosTericos
0 para x X1
i
F x para Xi x X i 1
n
1 para x X n
Se plantea la distancia de Kolmogorov-Smirnov, realizando restas por encima y por debajo
de la funcin entre la funcin de distribucin acumulada y la funcin de distribucin
emprica:
i i 1
i 1 ,,n
n
DKS F0 ,F max F0 Xi , F0 Xi
n
donde F0(x) es la funcin de distribucin acumulada
Finalmente, una vez obtenida la distancia de Kolmogorov-Smirnov se verifica que dicha
distancia sea menor o igual a la Distribucin del estadstico de Kolmogorov-Smirnov:
DKS Dn
Si y solo si esta condicin se cumple, se puede decir que se cumple la hiptesis nula H0
II.89
CaptuloII.FundamentosTericos
Los valores crticos estn tabulados y rechazaremos H0 para valores grandes del estadstico Wn2.
An2 n
F t F t
0
dF0 t
F
0 t 1 F0 t
Los valores crticos estn tabulados y rechazaremos H0 para valores grandes del estadstico An2.
Por tanto, el estadstico dar una medida de lo alejadas que se encuentran las observaciones de la
recta que representa la funcin de distribucin. Cuanto mejor sea el ajuste, tanto menor ser dicho
estadstico. Estos tres ltimos contrastes solo son vlidos cuando trabajamos con muestras
completas. Para trabajar con datos censurados se pueden obtener los valores crticos utilizando
tcnicas de remuestreo.
donde n es el nmero de datos, xj es el dato en orden ascendente de muestra que ocupa el lugar j,
es la media, h es n/2 si n es par o (n-1)/2 si n es impar y aj,n es un valor tabulado.
Figura45.FrecuenciasEsperadasyObservadasdeunaMuestraconlalneadeajusteaunadistribucinNormal.
II.90
CaptuloII.FundamentosTericos
Una vez calculado el estadstico W se contrasta con un valor W crtico para el nivel de significacin
elegido. Como este estadstico mide el ajuste a una recta y no la distancia a la distribucin Normal, la
hiptesis nula se acepta cuando el valor W es superior al valor de contraste tabulado (valor de ajuste
muy alto).
Al ser un porcentaje, el valor de R2 estar comprendido entre cero y uno, dando lugar a las
entre las variables. La especificacin del modelo podra sustituirse por: Yi = + ei, i = 1, ... ,n siendo
su estimacin: Yi Y ei , i = 1, ... ,n
Si R2 = 1 S e2y = 0 ei= 0, i = 1, ... ,n . El ajuste es perfecto. Los datos revelan una relacin lineal
existe relacin lineal entre las variables entonces R2 estar muy prximo a cero.
Figura46.RelacinentrexeyvaloresdeR2
II.91
CaptuloII.FundamentosTericos
Este coeficiente es muy importante, pues determina qu porcentaje (en tantos por uno) de la
varianza de la variable dependiente es explicado por el modelo de regresin.
Adems, a diferencia de la varianza residual, este coeficiente es adimensional, esto quiere decir
que no se ve afectado por transformaciones lineales de las variables; por tanto, si se cambian las
unidades de medida, el coeficiente de determinacin permanecer invariante.
1 si el componente funciona
Xi
0 si el componente no funciona
Se define , como el estado del sistema. Donde:
II.92
CaptuloII.FundamentosTericos
1 si el sistema funciona
0 si el sistema no funciona
La funcin de estructura es = (X), donde X = (x1;... ,xn) es el vector de los estados de los
componentes.
Un sistema representado por una funcin de estructura es coherente si cumple las siguientes
propiedades:
Relevancia de cada componente, es decir, no hay ninguna componente cuya fiabilidad no
afecte a la fiabilidad del sistema;
Monotonicidad, que encierra el concepto de que la fiabilidad de un sistema nunca puede
ser mejorada cuando uno de sus componentes se vuelva menos fiable.
Estas dos propiedades se pueden formular como:
El i-simo componente es irrelevante si, para todos los estados de los otros componentes
x1, ... ,xi-1, xi+1, ... ,xn el estado del sistema es el mismo, independientemente de que xi sea
0 o 1.
(x1, ... ,xi-1, 1,xi+1, ... ,xn) = (x1, ... ,xi-1, 0,xi+1, ... ,xn)
Nota: Si un componente no es irrelevante es relevante.
La monotonicidad de la funcin de estructura se refiere a la monotona de cada xi.
(x1, ... ,xi-1, 0,xi+1, ... ,xn) (x1, ... ,xi-1, 1,xi+1, ... ,xn)
Una funcin de estructura se define como un sistema coherente si es montona y cada
componente es relevante.
Figura47.SistemaenSerieFormadoporTresComponentes
II.93
CaptuloII.FundamentosTericos
n
X 1 1 xi
i 1
Figura48.SistemaenParaleloconTresComponentes
1 xi K
X
0 xi K
El sistema 2entre3 de la figura 49 est operativo si por lo menos dos componentes de una de las
tres cadenas estn operativos. En este caso la expresin anterior debera contener la restriccin que
los componentes fueran de la misma cadena.
Figura49.Sistema2ComponentesenSerieentre3enParalelo.
II.94
CaptuloII.FundamentosTericos
donde los componentes son independientes y R(t) es la fiabilidad del componente i, es decir, es la
probabilidad de que el componente i-simo funcione en el instante t, y donde (X) es la funcin de
estructura que define a xi = 1 si el componente funciona y xi = 0 si no funciona.
2.4.2.1.FiabilidaddeunSistemaenSerieconTasadeFalloConstante
Si los componentes son independientes, la fiabilidad de un sistema en serie se calcula por la regla
del producto. Es decir, un sistema en serie, con los componentes independientes, funciona s y slo s
todos los componentes funcionan:
R t R1 t R2 t Rn t
Se dice que hay un sistema en serie con tasadefalloconstante cuando todos los componentes
tienen tasa de fallo constante, es decir, cuando el tiempo de vida de los componentes se distribuye
exponencialde parmetro 1/i, R t e t y por la regla del producto:
R t e t 1 e t 2 e t n
O, equivalentemente:
R t e t
donde 1 1 1 1 .
1 2 n
Un sistema en serie con los componentes con tasa de fallo constante tiene la tasa de fallo constante
e igual a la suma de las tasas de fallo.
La vida media de un sistema en serie con los componentes con tasa de fallo constante se calcula a
partir de las vidas medias i = i de sus componentes:
1
1 1 1
1 2 n
En un sistema en serie complejo,formadoporgruposdecomponentesidnticos, si el primer grupo
tiene n1 componentes con tasa de fallo 1/1, el segundo n2 componentes con tasa de fallo 1/2, etc.,
las frmulas anteriores se pueden escribir como:
n n nk
R t R1 t 1 R2 t 2 Rn t
II.95
CaptuloII.FundamentosTericos
1
n1 n2 nk
1 2 n
donde i = i las vidas medias de los subgrupos de sus componentes.
La tasa de fallo de un sistema en serie, formado por ncomponentesidnticas con tasa de fallo 1/c
seria:
1 n
c
R t 1 1 R1 t 1 R2 t 1 Rn t
donde la probabilidad de que el sistema falle antes de un instante t seria:
Pr T t 1 R t 1 R1 t 1 R2 t 1 Rn t
Si todos los componentes son idnticos, con fiabilidad Rc(t), entonces la fiabilidad seria:
n
R t 1 1 Rc t
La fiabilidad de un sistema en paralelo, donde todos los componentes tienen tasa de fallo
constante, seria:
R t 1 1 et 1 1 et 2 1 et n
Se concluye que un sistema en paralelo, donde todos los componentes tengan tasa de fallo
constante, notienetasadefalloconstante.
En un sistema en paralelo si los componentes son idnticos, con tasa de fallo 1/c, la fiabilidad
seria:
n
R t 1 1 e t c
y la vida media puede obtenerse como:
II.96
CaptuloII.FundamentosTericos
1
c
1 1 1
1
2 3 n
1
Para n grande se puede utilizar la aproximacin c , donde es la constante de Euler:
ln n
= 0,577.
2.4.3. Redundancia
La redundancia es el principal mtodo para aumentar la fiabilidad de un sistema y se define como
la existencia de ms de un medio para realizar una determinada funcin. Estos medios no tienen por
qu ser idnticos (MIL-STD-721B).
La redundancia puede implicar el uso de dos o ms componentes o conjuntos idnticos, de forma
que cuando uno falla hay otros que realizan la funcin; o bien puede incluir medios diferentes para
realizar la funcin. Una rueda de repuesto de un automvil es un ejemplo de pieza redundante; el
sextante manual usado para la navegacin de un vehculo espacial en caso de fallo de los controles
automticos es un ejemplo del segundo mtodo.
En ambos ejemplos, el componente redundante (la rueda o el sextante) se usa slo cuando falla el
sistema primario. Este uso se llama redundanciasecuencial.
Otros sistemas redundantes se hacen funcionar simultneamente, de modo que todos los sistemas
utilizables (no fallados) realicen la funcin durante todo el tiempo. Este tipo se llama redundancia en
paralelo activo. El uso de cuatro motores en un avin es un ejemplo de redundancia en paralelo activo.
El tipo de redundancia viene impuesto ante todo por consideraciones de actuacin del sistema. La
redundancia secuencial proporciona tericamente ms fiabilidad que la redundancia en paralelo
activo si las funciones de deteccin de fallos y conmutacin son extremadamente fiables. En caso
contrario se prefiere la redundancia en paralelo activo desde el punto de vista de la fiabilidad. Ambos
tipos dan una fiabilidad del sistema mucho mejor que el sistema no redundante. Los clculos de la
fiabilidad de sistemas redundantes pueden resultar muy complicados. En esta apartado se presentan,
a ttulo de ejemplo, algunos clculos de fiabilidad de sistemas con componentes redundantes.
La norma MIL-STD-721 B define la redundanciaactiva (redundancia en paralelo activo) como la
redundancia de los sistemas en los que los objetos redundantes operan simultneamente, en lugar
de ser activados cuando son necesarios.
Y la redundanciasecuencial (standby) se define como la redundancia de los sistemas en los que el
medio alternativo de realizar una funcin no se activa hasta que es necesario, y es activado por el fallo
del medio primario de realizar la funcin.
II.97
CaptuloII.FundamentosTericos
Un ejemplo de redundancia activa sera el de un avin trimotor, que funciona siempre que
funcionen dos motores.
Consideraciones a tener en cuenta serian que, en un sistema secuencial (standby), el componente
redundante se activa mediante un interruptor que tiene su propia fiabilidad. Si la fiabilidad del
interruptor no es del 100%, se puede perder la fiabilidad ganada con la redundancia. Y adems, el
hecho de que el componente redundante no est activado mientras el otro funciona correctamente,
reduce las oportunidades de fallo. Por lo tanto, si la fiabilidad del interruptor es 100% fiable, un
sistema secuencial (standby) tiene una fiabilidad ms alta que un sistema en paralelo simple.
Para un sistema en paralelo con n componentes standby, con interruptor 100% fiable, con todos
los componentes con la misma tasa de fallo 1/, constante, la fiabilidad puede calcularse a travs de
la expresin:
t t2 t n1
Re t
1 2
2! n 1!n1
que es la expresin para un sistema con n unidades iguales y con (n-1) unidades de reserva. La
redundancia secuencial con interruptor 100% fiable requiere de menos componentes para alcanzar la
misma fiabilidad que la redundancia en paralelo activa.
Se supone que el dispositivo de deteccin de fallo no es perfectamente fiable, por lo que es preciso
tener en cuenta sus probabilidades de fallo. Si se supone que el diseo del sistema es tal que la funcin
de deteccin slo est ligada a las unidades de reserva y no afectan a la primera unidad que funciona,
entonces se incluye en la frmula la probabilidad de deteccin de fallo PSW.
En este caso, dado un sistema formado por dos componentes con tasa de fallo constante en
redundancia standby, si la activacin del componente es manual, mediante un interruptor 100%
fiable, y PSW es la probabilidad de deteccin, entonces la fiabilidad seria:
t
R t et 1 PSW
Observaciones.
Si la activacin se hace mediante un interruptor automtico con probabilidad de funcionar
p, la frmula tambin es vlida.
Si la activacin se hace mediante un interruptor automtico y la probabilidad de funcionar
es variable, se debe considerar la fiabilidad del interruptor. Cuando tiene tasa de fallo
constante 1/s, la frmula seria:
R t et 1 s et s
II.98
CaptuloII.FundamentosTericos
II.99
CaptuloIII.MetodologaExperimental
III.2
CaptuloIII.MetodologaExperimental
III.3
CaptuloIV.ResultadosyAnlisis
IV.2
CaptuloIV.ResultadosyAnlisis
Por la descripcin de los datos, se supone que a cada dispositivo corresponde un solo tiempo de
reparacin, que podra considerarse como de inspeccin, ya que no hay ms datos de vida despus
de la reparacin, por lo tanto se estar ante dispositivos no reparables, realizndose un estudio
completo sin censura, ya que se sabe que el estudio termina cuando han fallado todas las unidades.
Las variables aleatorias continuas tomaran los valores indicados en el apartado 2.2.2.
Disponibilidad, de tal forma que el tiempo de fallo seria el tiempo que el dispositivo estara operativo
desde su puesta en marcha hasta su parada TTF que conforman el llamado MTTF (Mean Time To
Failure) y el tiempo de reparacin como el tiempo de parada por reparacin TTR que conforman el
MTTR (Mean Time To Restoration).
Se realizaran dos estudios, uno de fiabilidad de los dispositivos mediante la muestra de tiempos de
operacin TTF y otro estudio de mantenibilidad con los datos de reparacin TTR
IV.3
CaptuloIV.ResultadosyAnlisis
De las medidas de centralizacin se puede observar que el tiempo medio fue de 55.06 das pero el
mximo tiempo operativo de un dispositivo fue de 351,25 das y el tiempo mnimo fue de 0.11 da,
siendo de 0.68 das el valor ms frecuente (2 veces) y de 19.59 el valor mediano. En el 50% de los
casos el tiempo operativo oscila entre 4.33 das y 77.39.
Los tiempos se encuentran en un rango de 351.14 das, presentando una dispersin elevada con
una varianza de 5782.22 y con una desviacin tpica de 76.04.
La elevada diferencia entre la media y la mediana x Md , reflejara un elevado grado de asimetra
hacia la derecha, teniendo la distribucin de los datos a la derecha una cola ms larga que a la
izquierda, quedando ratificado por el coeficiente de asimetra 2.186 ( 0.5 aprox. para distribucin
Simtrica). El coeficiente curtosis presenta un valor muy elevado (5.038), la distribucin ser
leptocrtica (curtosis muy elevada), presentando una alta concentracin de valores en la cola de la
distribucin ( 0.5 aprox. cuando la distribucin es Mesocrtica). Esto se pone claramente de
manifiesto en el histograma (Figura 49) con una distribucin normal.
Se obtiene informacin ms clara de las variables de inters mediante los histogramas de la figura
51 y 52, donde se presenta la frecuencia de los tiempos hasta el fallo. Se puede observar que la
mayora de los dispositivos tienen un tiempo hasta el fallo menor a 80 das (3 cuartil) y en general se
presenta el fallo los primeros 20 das (mediana), aunque hay algunas unidades que fallan entre 80 y
200 das.
La asimetra mencionada anteriormente se debe a las diferencias existentes entre los tiempos de
fallo de la mayora de los dispositivos y 5 dispositivos que tienen un tiempo operativo
extraordinariamente mayor (entre 200 y 350 das).
IV.4
CaptuloIV.ResultadosyAnlisis
IV.5
CaptuloIV.ResultadosyAnlisis
circunstancias, son un paso intermedio hacia un modelo ms estructurado (paramtrico), que permita
profundizar ms en el anlisis de las observaciones.
S t Z ee S t
1
2
donde Z
es el cuantil correspondiente a la distribucin normal estndar y
1
2
ee S t Var S t
es el error estndar de estimacin del estimador KM de S(t), que se calcula
con la frmula de Greewood de la varianza del estimador KM, el cual viene dado por la expresin
2 dt
Var S t S t j:t j t
nj nj dt
En el apartado 2.2. del Apndice 4, se puede observar el programa realizado en R para el anlisis
no paramtrico con comentarios adicionales.
El estimador de Kaplan-Maier para la funcin de supervivencia es obtenido mediante la librera
Survival de R con la funcin survfit. Esta funcin en su forma ms sencilla, solo requiere un objeto de
supervivencia creado por la funcin Surv, en el cual se captura el tiempo observado de la variable y su
estado (censurado o no).
Presenta los argumentos time y event. El argumento time corresponde al tiempo desde que el
dispositivo entra al estudio, hasta que este presenta el fallo o censura. El argumento event es una
variable binaria que indica el estatus del tiempo registrado, donde, de forma predeterminada
corresponde a
0 <- si el dato es censurado
1 <- si el fallo es observado
IV.6
CaptuloIV.ResultadosyAnlisis
Debido que no se tiene informacin de datos censurados, se asumir un estudio con datos
completos. Los dispositivos han fallado en el tiempo de control y, por tanto, su estado se representara
por 1 en todos ellos.
La funcin survfit de R indicara la informacin del estimador de Kaplan-Meier para la funcin de
supervivencia(tabla 2), donde n corresponde al nmero de individuos en estudio, events corresponde
al nmero de fallos presentadas en los n individuos (por tanto, el nmero de censuras est dado por
n - events), median es el tiempo mediano antes de que se presente la falla con respecto a la curva de
la funcin de supervivencia estimada (el tiempo t tal que S(t) = .5 ), 0.95LCL es lmite inferior de una
banda estimada con un 95% de confianza para el valor de median y 0.95UCL es lmite superior de una
banda estimada con un 95 % de confianza para el valor de median (esta banda es estimada por el
mtodo ordinario).
Tabla 2. Estimador de Kaplan-Meier para el Tiempo Operativo TTF
records n.max n.start events median 0.95LCL 0.95UCL
80 80 80 80 19.6 12.8 41.5
En el caso del Tiempo Operativo TTF, se tienen 80 sujetos de estudio, los 80 presentan fallo y 0
presentan censura, el tiempo mediano antes de presentar fallo es de 19.6 y un intervalo con un 95 %
de confianza est dado en su lmite inferior por 12.8 y en su lmite superior por 41.5 (en los intervalos
de confianza obtenidos por la funcin survfit, para Inf toma el valor de 1 y -inf toma el valor de 0).
Informacin adicional se puede obtener mediante la funcin summary como se indica en la tabla
3 (en el apartado 2.1. del Apndice 4 se puede observar la tabla completa)
Tabla 3. Informacin del Estimador de Kaplan-Meier
time n.risk n.event survival std.err lower95%CI upper95%CI
0.11 80 1 0.9875 0.0124 0.96315 1
0.28 79 1 0.975 0.0175 0.94079 1
0.31 78 1 0.9625 0.0212 0.92087 1
0.63 77 1 0.95 0.0244 0.90224 0.9978
0.68 76 2 0.925 0.0294 0.86728 0.9827
0.83 74 1 0.9125 0.0316 0.85058 0.9744
1.03 73 1 0.9 0.0335 0.83426 0.9657
1.06 72 1 0.8875 0.0353 0.81826 0.9567
1.14 71 1 0.875 0.037 0.80253 0.9475
1.4 70 1 0.8625 0.0385 0.78704 0.938
1.63 69 1 0.85 0.0399 0.77175 0.9282
1.65 68 1 0.8375 0.0412 0.75666 0.9183
1.69 67 1 0.825 0.0425 0.74174 0.9083
1.73 66 1 0.8125 0.0436 0.72697 0.898
1.96 65 1 0.8 0.0447 0.71235 0.8877
1.97 64 1 0.7875 0.0457 0.69786 0.8771
2.11 63 1 0.775 0.0467 0.68349 0.8665
2.94 62 1 0.7625 0.0476 0.66925 0.8558
IV.7
CaptuloIV.ResultadosyAnlisis
IV.8
CaptuloIV.ResultadosyAnlisis
IV.9
CaptuloIV.ResultadosyAnlisis
IV.10
CaptuloIV.ResultadosyAnlisis
De las 4 funciones de fiabilidad paramtricas propuestas, la funcin Weibull y Gamma seran las
que presentan un ajuste ms acentuado a la funcin de supervivencia
IV.11
CaptuloIV.ResultadosyAnlisis
Las funciones logNormal y Exponencial difieren del patrn mostrado por la funcin de riesgo,
principalmente esta ltima, ya que es conocido que la exponencial tiene una tasa de fallo constante
en el tiempo. La funcin de Weibull presenta una posicin cuasi paralela a la funcin no paramtrica
y finalmente la funcin Gamma presenta un grfico cercano e irregular con relacin a la funcin de
estudio.
IV.12
CaptuloIV.ResultadosyAnlisis
La Funcin de Weibull y Gamma seran las que presentaran un ajuste ms cercano a la funcin en
estudio. Las funciones LogNormal y Exponencial difieren de la funcin de estudio principalmente a
partir de los 100 das.
En todos los grficos se puede observar claramente la existencia de aproximacin de dos
distribuciones paramtricas (Weibull y Gamma) a los datos no paramtricos.
Las funciones principales resultantes con los parmetros obtenidos, se muestran en las figuras 61-
63.
Figura 61. Funcin de Supervivencia o Fiabilidad Weibull Figura 62. Funcin de Riesgo Weibull
IV.13
CaptuloIV.ResultadosyAnlisis
IV.14
CaptuloIV.ResultadosyAnlisis
Es por ello que se utilizan los grficos de probabilidad, los cuales hacen uso de escalas especiales en
los ejes, de manera que al representar la f.d. sta tenga forma lineal.
Este tipo de grficos muestran la f.d. linealizada de una distribucin terica junto con una nube de
puntos que representan estimaciones puntuales de la f.d. de T. Evidentemente, cuanto ms se
aproxime la nube de puntos a la recta que aparece en el grfico, tanto mejor ser el ajuste.
Si se lograse aproximar la distribucin de T mediante alguna distribucin terica conocida, sera
posible usar esta ltima para representar grficamente estimaciones de la funcin de distribucin
Los diagramas de cuantiles (Q-Q plots) comparan en un sistema de coordenadas cartesianas, los
cuantiles de la distribucin terica (eje X) con los cuantiles mustrales (eje Y)
En la Figura 64 se muestran diagramas de cuantiles para seis distribuciones tericas (normal,
lognormal, Exponencial, Weibull, Gamma, Poisson) de ajuste a los cuantiles de las observaciones,
estas han sido realizadas mediante la funcin "fitdistr" de R (Apndice 4, apartado 2.3.1. Anlisis
Grafico), los parmetros de la distribucin terica univariante no son fijados y realizndose su
estimacin por mxima verosimilitud.
IV.15
CaptuloIV.ResultadosyAnlisis
Se puede observar como los puntos representados en el grfico estn suficientemente prximos a
la recta presentado una distribucin Leptocrtica para las distribuciones de Weibull y Gamma, por lo
que se podra dar por bueno el ajuste de las observaciones mediante dichas distribuciones.
Se podra considerar la distribucin exponencial, pero se ha de descartar ya que esta distribucin
tiene una tasa de fallo constante y los datos aportados no siguen dicha distribucin como fue
comentada en el anlisis descriptivo.
En teora esta tcnica descriptiva debera de haber sido suficiente para realizar la discriminacin
entre la distribucin de las observaciones y las diferentes distribuciones tericas propuestas, pero a
la vista de los resultados, no es suficiente.
Por lo que se cree conveniente realizar un test analtico que ayude a tomar la decisin de la
distribucin terica ms acertada (aunque conociendo que no formara parte de este apartado de
estimacin grafica).
La idea inicial seria realizar un test de bondad de ajuste y observar el resultado del estadstico. Se
ha optado realizar el test de Kolmogorov-Smirnov mediante la funcin "fitdistr" en R (Apndice 4,
apartado 2.3.1.2. Ajuste Analtico Preliminar), se trata de un test que analiza la diferencia entre las
frecuencias relativas acumuladas de las distribuciones terica y emprica. En la tabla 5 se indican los
resultados obtenidos:
Tabla 5. Ajuste Analtico ordenado por Ks stat
Si son observados los valores del estadstico de K-S, los cuales habra que comparar con el
establecido en la tabla K-S D0.05, 80 =1.36/80 = 0.1521 para un nivel de signicacin de 5% y una
muestra de 80 observaciones, se tendra que dado que el estadstico de las distribuciones Weibull y
Gamma son menores que el valor de la tabla (0.1521) no se puede rechazar la hiptesis de que las
observaciones sigan la distribucin terica. Por tanto, el uso del estadstico K-S o el K-S p-value no es
suficiente ((P-value mayores de 0.05 indicaran que las observaciones proviene de la distribucin
seleccionada con 95% de confianza), ya que es un test muy conservador y no indica claramente la
distribucin ptima.
Pero si analizamos los resultados ordenados en la tabla 6 para el estadstico de log verosimilitud
(no es ms que el logaritmo de la verosimilitud para la estimacin de los parmetros de una
distribucin de probabilidad mediante el "mtodo de mxima verosimilitud" (en ingls "method of
IV.16
CaptuloIV.ResultadosyAnlisis
maximum likelihood" o MLE), se observa como la distribucin que tiene un ajuste optimo seria la
distribucin Weibull.
Tabla 6. Ajuste Analtico ordenado por Log_Likelihood
distribution param1 param2 Log_Likelihood ks stat ks pvalue
[1,] "weibull" "0.638" "40.168" "-384.966" "0.083" "0.63277"
[2,] "gamma" "0.516" "0.009" "-385.115" "0.077" "0.73142"
[3,] "lognormal" "2.782" "1.922" "-388.368" "0.119" "0.20757"
[4,] "exponential" "0.018" "NA" "-400.671" "0.221" "0.00082"
[5,] "normal" "55.058" "75.564" "-459.514" "0.234" "0.00032"
[6,] "poisson" "55.058" "NA" "-Inf" "0.583" "0"
IV.17
CaptuloIV.ResultadosyAnlisis
Se puede observar como para un parmetro de forma = 1, que correspondera con un valor del
63.2 % de la Funcin Acumulada de Fallos (eje y), este cortara a recta de regresin en un punto que
dara un valor de Tiempo de Fallo (eje x), que sera el valor de la escala , siendo en este caso de 40
das aproximadamente.
t
1
1 e 1 1 0.632 63.2%
1
F t , , 0 1 e
e
En la figura 66, se presenta un grfico similar al anterior pero en escala diferente para poder
realizar de una forma ms sencilla el clculos de los parmetros de la distribucin, el valor de
vendra dado a travs del clculo de la pendiente de la recta, siendo este el ngulo que forma la
lnea horizontal del eje y con valor 0 y la proyeccin del valor ms elevado sobre la recta (color
verde) y la proyeccin en el eje x del punto de la lnea con y=0. Matemticamente seria =y/x=
1.5/(6-3.7)= 0.65217
Para la escala , a travs de la ordenada en el origen y considerando que =exp(-b/), b seria el
valor en el eje y para x=0, en la figura muestra un valor aproximado de -2.33, por tanto se tendr
que =exp(-b/) = exp(-(-2.3)/0.65217) = 34.0104. Por tanto, los valores de los parmetros de la
distribucin de Weibull que se ajustan a las observaciones serian
Forma = 0.65217 Escala = 34.0104.
Y la recta de regresin para esta estimacin vendra dada por y= --2.3 + 0.65217 x.
IV.18
CaptuloIV.ResultadosyAnlisis
IV.19
CaptuloIV.ResultadosyAnlisis
Finamente, en la figura 68 se presenta una revisin de los residuos o errores del ajuste realizado.
En la grfica Residual & Fitted se observa un agrupamiento en una zona del grfico y valores
dispersos en el lado izquierdo, por lo que tanto la homocedasticidad como la linealidad podran
tener cierto problema. Mediante el Q-Q plot se puede comprobar la hiptesis de normalidad de los
residuos, los puntos no estn situados sobre la diagonal del grfico, estando bien alineados en el
lado derecho, pero no as en el izquierdo. Por lo tanto, la normalidad parece no aceptable.
En la grfica Residuals Vs. Leverag se presenta el clculo de hasta qu punto los valores predichos
para los datos se mueven si el modelo fuera ajustado sin el punto de datos en cuestin. Esta
distancia total calculada se denomina distancia de Cook, donde hay 1 punto con una distancia mayor
de 1 y otro muy cercano a 0.5.
IV.20
CaptuloIV.ResultadosyAnlisis
IV.21
CaptuloIV.ResultadosyAnlisis
Librera Renext
Mediante la funcin fweibull de la librera Renext se puede calcular las estimaciones por
mxima verosimilitud de los parmetros de la distribucin Weibull para muestras
completas. Los valores de los parmetros serian:
Forma = 0.63793 Escala = 40.12060
IV.22
CaptuloIV.ResultadosyAnlisis
En la figura 69 se muestra la grfica de regresin lineal mnimo cuadrtica con los intervalos de
confianza y prediccin al 95% para valores originales de tiempo (rojo). Tambin estn representados
los intervalos de confianza y prediccin al 95% para nuevos valores de tiempo (extrapolados y ms
finamente/uniformemente espaciados que los datos originales) (azul). Los intervalos ms estrechos
corresponderan a los intervalos de confianza al 95% para los valores esperado de los tiempos de fallo,
mientras que los intervalos ms amplios corresponderan a los valores de las observaciones de los
tiempos de fallo. Estas diferencias son debidas a la varianza del error producida por las
perturbaciones.
IV.23
CaptuloIV.ResultadosyAnlisis
donde
x
i
i 0.3
F xi 1 e y F xi
n 0.4
La Tabla 7 muestra los resultados de las estimaciones para los parmetros de forma y escala y el
error cuadrtico medio (MSE) para cada mtodo.
IV.24
CaptuloIV.ResultadosyAnlisis
Mtodo MSE
EstimacinNoParamtrica-(Lib.Survival-MLE)
= 0.63793 = 40.1205 0.1106877
AnlisisParamtrico
-EstimacinGraficaParamtrica
= 0.65217 = 34.0104 0.2075554
-EstimacinPuntual
1.EstimacinporMnimosCuadrados-LSM
= 0.6299 = 39.6759 0.1041902
2.EstimacinporMximaVerosimilitud-MLE
2.1.ObservacionesCompletas
2.1.1.Librerafitdistrplus
= 0.63798 = 40.11665 0.1107554
2.1.2.LibreraRenext
= 0.63793 = 40.12060 0.1106874
2.2.ObservacionesconCensura-Lib.START
= 0.63792 = 40.12036 0.1106773
3.EstimacinporMomentos-MOM
= 0.66048 = 41.00853 0.1363857
En la tabla 8, se presentan los resultados ordenados por MSE de menor a mayor. La estimacin por
LSM por mnimos cuadrados es la que presenta un menor MSE, para unos valores de = 0.6299 y =
39.6759.
Tabla 8.Resultados Ordenados del Estudio Comparativo de Parmetros
Mtodo MSE
LSM - Est. por Mnimos Cuadrados 0.10419
MLE - Obs. con Censura - Lib. START 0.110677
MLE - Obs. Completas - lib. Renext 0.110687
MLE - Est. No Paramtrica - Lib. Survival 0.110688
MLE - Obs. Completas - lib. fitdistrplus 0.110755
MOM - Est. por Momentos 0.136386
Estimacin Grafica 0.207555
IV.25
CaptuloIV.ResultadosyAnlisis
Inicialmente podra pensarse que carece de sentido que el mtodo de momentos fuera el peor
evaluado, podra haber ocurrido algn error de clculo debido a su uso o errores internos de la librera
lmon, la cual fue desarrollada para funciones de 3 parmetros, ya que tiene ms error que la
estimacin grfica. Por tanto, para los valores y la cantidad de observaciones (80) se ha propuesto
como los parmetros que provienen del estudio de mnimos cuadrados como los ms acertados para
la distribucin de Weibull.
Para poder evaluar si los mtodos y clculos han sido los acertados, se han comparado los
resultados con programas como Minitab y Statgraphics Centurion XVI , se encuentra que ambos
programas utilizan MLE y las estimaciones que se han realizado en los clculos mediante MLE son muy
similares a las ofrecidas por los programas comerciales, segn se muestra en la tabla 9.
Tabla 9.Resultados de Anlisis en Programas Comerciales
IV.26
CaptuloIV.ResultadosyAnlisis
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.31855 0.0436 -53.18 <2e-16 ***
X 0.62988 0.01289 48.86 <2e-16 ***
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
IV.27
CaptuloIV.ResultadosyAnlisis
Response: Y(RM)
Df Sum Sq Mean Sq F value Pr(>F)
X 1 117.254 117.254 2387.2 <0.00000000000000022 ***
Residuals 78 3.831 0.049
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
IV.28
CaptuloIV.ResultadosyAnlisis
Para el ajuste de distribuciones discretas ser utilizado con la misma funcin el estadstico chi-
cuadrado pero con el argumento chisqbreaks o meancount.
Tambin se ha usado la funcin test_ks_dweibull del paquete Sim.DiffProc que realizara el test de
Kolmogorov Smirnov para contrastar la hiptesis si un conjunto de datos sigue o no un modelo de
distribucin Weibull.
Se ha definido en la aplicacin realizada realizar el test de chi-cuadrado para muestras mayores de
30. Pero se ofrecen los estadsticos de Cramer-von Mises, Kolmogorov-Smirnov y Anderson-Darling,
as como la posibilidad de realidad fuera de la aplicacin el test de contraste de Kolmogorov Smirnov.
En la tabla 13 se indican los resultados aportados por la aplicacin desarrollada para los parmetros
obtenidos en el apartado 4.2.3.4. Comparacin de Mtodos de Estimacin de Parmetros, donde
fueron seleccionados los parmetros con menor error cuadrtico medio (MSE) correspondiente a la
estimacin por Mnimos Cuadrados - LSM, siendo para la forma = 0.6299 y para la escala = 39.6759.
Se puede observar como el valor del estadstico obtenido de ks es de 0.0833, comparndolo con el
establecido en la tabla para un nivel de significacin de 5% y una muestra de 80 (tabla K-S) se tendr
un valor de D(0.05,80)=1.36/(raiz2(80))= 0.1521. Dado que el estadstico (0.0833) es menor que el
valor de la tabla (0,1521), no se puede rechazar la hiptesis de que las observaciones no sigan la
distribucin terica. Igualmente, si se analiza el resultado del test de chi-cuadrado, el p-valor es mayor
que el nivel de significancia de 0.05., Por tanto no se puede rechazar la idea de que los datos provienen
de una distribucin Weibull con 95% de confianza.
Tabla 13. Estadsticos de ajuste y test chi-cuadrado
Kolmogorov-Smirnov statistic: 0.08333777
Cramer-von Mises statistic: 0.1082396
Anderson-Darling statistic: 0.6589706
n shape scale chi.chisqpvalue
Resultados 80 0.6299 39.6759 0.3004417
En la tabla 14 se indican los resultados aportados por el test individual procedentes de la librera,
Sim.DiffProc, donde el estadstico es diferente al presentado para k-s anteriormente, pero en ambos
casos el estadstico obtenido es menor que el valor de la tabla (0,1521), por lo que no se puede
rechazar la hiptesis de que las observaciones no sigan la distribucin terica. As, mismo el resultado
del p-valor es mayor que el nivel de significancia de 0.05., Por tanto no se puede rechazar la idea de
que los datos provienen de una distribucin Weibull con 95% de confianza.
Tabla 14. Test de Ajuste de Kolmogorov-Smirnov
One-sample Kolmogorov-Smirnov test
data: X
D = 0.0793, p-value = 0.6964
alternative hypothesis: two-sided
IV.29
CaptuloIV.ResultadosyAnlisis
Como se muestra en la figura 70, esta es una funcin creciente y tiende a 0 cuando el tiempo de
fallo tiende a .La probabilidad de fallo vendra indicada por el rea delimitada entre el eje de
abscisas, la lnea curva y el punto de ordenadas o tiempo de fallo. A un mayor tiempo de fallo, se
tendra una mayor probabilidad de fallo. Para tiempos bajos de fallo, se tiene un rea elevada,
indicando una alta probabilidad de fallo debido a una alta mortalidad infantil. El rea total bajo la
curva en un tiempo de fallo infinito sera de 1.
IV.30
CaptuloIV.ResultadosyAnlisis
Como se observa en la figura 71, esta es una funcin es creciente y tiende a 1 cuando el tiempo de
fallo tiende a . Siendo esta una funcin acumulada de probabilidad crece muy rpidamente,
teniendo aproximadamente un 80% de posibilidad de fallo a los 80 das. La probabilidad de ocurrencia
de un fallo en un intervalo de tiempo t1 - t2 pata t2 > t1 seria Ft2 -Ft1.
En la figura 72 se puede observar como esta funcin decreciente y tiende a 0 cuando t . Esta
funcin representa la probabilidad de sobrevivir sin fallos a un tiempo en das. La informacin que
ofrece esta grafica es similar a la funcin de distribucin pero en lugar de tiempos de fallo seria de
tiempos de supervivencia.
IV.31
CaptuloIV.ResultadosyAnlisis
Y en la figura 73 se muestra cmo evoluciona con el tiempo el riesgo de fallo. Como se describi
en el apartado terico al estar comprendido el valor de entre 0 y 1, la funcin de riesgo es
decreciente, disminuyendo la tasa de fallo al aumentar el tiempo. Tambin se observa una zona de al
comienzo del tiempo en la que existe un alto riesgo de fallo debido a la mortalidad infantil, pero con
el paso del tiempo decrece el riesgo de fallo. No se detecta una zona de envejecimiento o desgaste,
en la que un aumento del tiempo llevara un aumento del riesgo o la tasa de fallo.
IV.32
CaptuloIV.ResultadosyAnlisis
Si H(t) es lineal en t entonces la funcin tasa de fallos o funcin de riesgo h(t), es constante.
Si H(t) es convexa con derivada primera creciente en t entonces la funcin tasa de fallos o
funcin de riesgo h(t), es creciente.
Si H(t) es convexa con derivada primera decreciente en t entonces la funcin tasa de fallos
o funcin de riesgo h(t), es decreciente.
En la figura 74 se muestran cmo aunque parecera seguir una forma lineal, se observa como al
inicio de la grfica cierta curvatura en el sentido de una funcin convexa con derivada decreciente, lo
que explicara la forma decreciente de la funcin tasa de fallos.
IV.33
CaptuloIV.ResultadosyAnlisis
1 1
E T 1 39.6759 1 56.19593
0.6299
1 1
Donde 1 es la funcin Gamma x , para x 1
2
1 2 2 2
1
2
2
Var T 1 1 39.6759 1 1 6468.7
0.6299 0.6299
4.2.3.6.8. p-cuantil
La expresin matemtica vendra dada por:
1 1
t p log 1 p 39 .6759 log 1 p 0 .6299
IV.34
CaptuloIV.ResultadosyAnlisis
Figura 75. Funcin de Distribucin F(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)
Figura 76. Funcin de Fiabilidad R(t) o Supervivencia S(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)
IV.35
CaptuloIV.ResultadosyAnlisis
Figura 77. Funcin de Riesgo o Tasa de Fallo h(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)
Figura 78. Funcin de Riesgo Acumulado H(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)
IV.36
CaptuloIV.ResultadosyAnlisis
De las medidas de centralizacin se puede observar que el tiempo medio fue de 0.5716 das pero
el mximo tiempo de reparacin de un dispositivo fue de 3.861 das y el tiempo mnimo fue de 0.0104
da, siendo de 0.0417 das el tiempo ms frecuente (3 veces) y de 0.1962 el valor mediano. En el 50%
de los casos el tiempo de reparacin oscila entre 0.086 y 0.75 das.
Los tiempos se encuentran en un rango de 3.85 das, presentando una dispersin baja con una
varianza de 0.62618 y con una desviacin tpica de 0.7913, siendo estos valores muy inferiores a los
presentados en el estudio de fiabilidad. Estos datos indican que los datos de esta variable continua
estn menos dispersos respectos a sus valores centrales, lo que supone una representatividad ms
elevada de los valores de la poblacin.
La diferencia entre la media y la mediana, as como de la mediana y la moda x Md Mo , reflejara
un elevado grado de asimetra hacia la derecha, teniendo la distribucin de los datos a la derecha una
cola ms larga que a la izquierda, quedando ratificado por el coeficiente de asimetra 2.240 ( 0.5
aprox. para distribucin Simtrica). El coeficiente curtosis presenta un valor muy elevado (5.136), la
distribucin ser leptocrtica (curtosis muy elevada), presentando una alta concentracin de valores
IV.37
CaptuloIV.ResultadosyAnlisis
IV.38
CaptuloIV.ResultadosyAnlisis
IV.39
CaptuloIV.ResultadosyAnlisis
Se puede observar varias graficas en como los puntos representados en el grfico estn
suficientemente prximos a la recta presentado una distribucin Leptocrtica para las distribuciones
pero no es muy clara cul debera ser la distribucin a elegir.
En teora esta tcnica descriptiva debera de haber sido suficiente para realizar la discriminacin
entre la distribucin de las observaciones y las diferentes distribuciones tericas propuestas, pero a
la vista de los resultados, no es suficiente.
Por lo que se cree conveniente realizar un test analtico que ayude a tomar la decisin de la
distribucin terica ms acertada (aunque conociendo que no formara parte de este apartado de
estimacin grafica).
La idea inicial seria realizar un test de bondad de ajuste y observar el resultado del estadstico. Se
ha optado realizar el test de Kolmogorov-Smirnov mediante la funcin "fitdistr" en R (Apndice 4,
apartado 3.2.1.2. Ajuste Analtico Preliminar), se trata de un test que analiza la diferencia entre las
IV.40
CaptuloIV.ResultadosyAnlisis
frecuencias relativas acumuladas de las distribuciones terica y emprica. En la tabla 16 se indican los
resultados obtenidos:
Tabla 16. Ajuste Analtico ordenado por Ks stat
distribution param1 param2 Log_Likelihood ks stat ks pvalue
[1,] "lognormal" "-1.423" "1.377" "-25.291" "0.093" "0.49896"
[2,] "weibull" "0.77" "0.481" "-29.726" "0.127" "0.15149"
[3,] "gamma" "0.7" "1.225" "-31.378" "0.15" "0.05341"
[4,] "exponential" "1.75" "NA" "-35.252" "0.231" "0.00039"
[5,] "normal" "0.572" "0.786" "-94.287" "0.238" "0.00024"
[6,] "poisson" "0.572" "NA" "-Inf" "0.565" "0"
Si son observados los valores del estadstico de K-S, los cuales habra que comparar con el
establecido en la tabla K-S D0.05, 80 =1.36/80 = 0.1521 para un nivel de signicacin de 5% y una
muestra de 80 observaciones, se tendra que dado que el estadstico de las distribuciones Lognormal,
Weibull y Gamma son menores que el valor de la tabla (0.1521) no se puede rechazar la hiptesis de
que las observaciones sigan la distribucin terica. Por tanto, el uso del estadstico K-S o el K-S p-value
no es suficiente ((P-value mayores de 0.05 indicaran que las observaciones proviene de la distribucin
seleccionada con 95% de confianza), ya que es un test muy conservador y no indica claramente la
distribucin ptima.
Pero si analizamos los resultados ordenados en la tabla 17 para el estadstico de log verosimilitud
(no es ms que el logaritmo de la verosimilitud para la estimacin de los parmetros de una
distribucin de probabilidad mediante el "mtodo de mxima verosimilitud" (en ingls "method of
maximum likelihood" o MLE), se observa como la distribucin que tiene un ajuste ms ptimo sera la
distribucin Lognormal.
Tabla 17. Ajuste Analtico ordenado por Log_Likelihood
distribution param1 param2 Log_Likelihood ks stat ks pvalue
[1,] "lognormal" "-1.423" "1.377" "-25.291" "0.093" "0.49896"
[2,] "weibull" "0.77" "0.481" "-29.726" "0.127" "0.15149"
[3,] "gamma" "0.7" "1.225" "-31.378" "0.15" "0.05341"
[4,] "exponential" "1.75" "NA" "-35.252" "0.231" "0.00039"
[5,] "normal" "0.572" "0.786" "-94.287" "0.238" "0.00024"
[6,] "poisson" "0.572" "NA" "-Inf" "0.565" "0"
IV.41
CaptuloIV.ResultadosyAnlisis
y una desviacin estndar de b = . El anlisis de los medibles de fiabilidad se realiza con la estimacin
de los parmetros y de la distribucin log-normal bajo el ln(t).
Cuando un ajuste sea vlido (mayor de 0.95 para el coeficiente de correlacin en la regresin
lineal), la funcin de densidad de la distribucin que representara los datos, tendra la forma:
1 ln t 2
1 2
f t e
t0
t 2
Donde y se corresponden con la media y la desviacin tpica del logaritmo de los tiempos de
reparacin.
La funcin de no reparabilidad para una variable aleatoria con distribucin lognormal, se puede
escribir como:
ln t
R t
donde es la funcin de distribucin estndar.
La linealizacin de la funcin de no reparabilidad (supervivencia) de la distribucin log-normal
vendra dada por:
ln t
1 R t 1 1 F t 1 1 F pi
donde -1 se corresponde con los cuantiles de la distribucin normal estndar.
Por tanto, los datos observacionales siguen una distribucin lognormal, si los puntos:
1 i 0.3
1 n 0.4 , ln t
Para i = 1, 2, , 80 estn en secuencia.
Podemos estimar, adems, los parmetros y a travs de la pendiente de la recta, 1/ y la
ordenada en el origen, /.
IV.42
CaptuloIV.ResultadosyAnlisis
En la figura 82 se muestra como las la nube de puntos de las observaciones con respecto a su recta
de regresin asociada sigue un patrn bastante lineal, por lo cual es coherente pensar que las
observaciones puedan seguir una distribucin lognormal, pero hay que indicar como a la izquierda de
la recta existe una cola de datos hacia abajo lo que es indicativo de la existencia de un valor en el
parmetro de localizacin y para que los clculos estuvieran ajustados habra que realizar este estudio
de forma triparamtrica. Se obviara la consideracin anterior y se seguir analizando los datos para
una distribucin Lognormal biparamtrica.
IV.43
CaptuloIV.ResultadosyAnlisis
IV.44
CaptuloIV.ResultadosyAnlisis
de mnimos cuadrados que relaciona la variable independiente con la variable dependiente vienen
dados como resultado de la regresin lineal por:
Coefficients:
(Intercept) X
-0.9977 0.7013
Por lo tanto, la ecuacin de la recta de mnimos cuadrados seria y= -0.9977 + 0.7013 x.
Obtenindose los siguientes valores para los parmetros despus del clculo realizado
Des. Estand. = 1.4258 Media = -1.4225
IV.45
CaptuloIV.ResultadosyAnlisis
En la figura 84 se muestra la grfica de regresin lineal mnimo cuadrtica con los intervalos de
confianza y prediccin al 95% para valores originales de tiempo (rojo). Tambin estn representados
los intervalos de confianza y prediccin al 95% para nuevos valores de tiempo (extrapolados y ms
finamente/uniformemente espaciados que los datos originales) (azul). Los intervalos ms estrechos
corresponderan a los intervalos de confianza al 95% para los valores esperado de los tiempos de
reparacin, mientras que los intervalos ms amplios corresponderan a los valores de las
observaciones de los tiempos de reparacin. Estas diferencias son debidas a la varianza del error
producida por las perturbaciones.
IV.46
CaptuloIV.ResultadosyAnlisis
IV.47
CaptuloIV.ResultadosyAnlisis
donde:
lnt i 0.3
F t y F xi
n 0.4
La Tabla 18 muestra los resultados de las estimaciones para los parmetros de forma y escala y el
error cuadrtico medio (MSE) para cada mtodo.
Des. Estand. = 1.3819 y de Media =-1.4115, t
Tabla 18.Resultados del Estudio Comparativo de Parmetros
Mtodo MSE
EstimacinNoParamtrica-(Lib.Survival-MLE)
= 1.37678 = -1.42255 18.51123
AnlisisParamtrico
-EstimacinGraficaParamtrica
= 1.375 = -1.375 16.06686
-EstimacinPuntual
1.EstimacinporMnimosCuadrados-LSM
= 1.4258 = -1.4225 20.20958
2.EstimacinporMximaVerosimilitud-MLE
2.1.ObservacionesCompletas
2.1.1.Librerafitdistrplus
= 1.37678 = -1.42255 18.51123
2.2.ObservacionesconCensura-Lib.START
= 1.37678 = -1.42255 18.51123
3.EstimacinporMomentos-MOM
= 1.28233 = -1.38153 14.97755
En la tabla 19, se presentan los resultados ordenados por MSE de menor a mayor. La estimacin
por Momentos MOM es la que presenta un menor MSE, para unos valores de = 1.28233 y = -
IV.48
CaptuloIV.ResultadosyAnlisis
1.38153. Los valores de MSE son elevados debido los errores producidos en la aplicacin de la
distribucin normal estndar a valores negativos o mayores de 1.
Tabla 19.Resultados Ordenados del Estudio Comparativo de Parmetros
Mtodo MSE
MOM - Est. por Momentos 14.97755
Estimacin Grafica 16.06686
MLE - Est. No Paramtrica - Lib. Survival 18.51123
MLE - Obs. Completas - lib. fitdistrplus 18.51123
MLE - Obs. con Censura - Lib. START 18.51123
LSM - Est. por Mnimos Cuadrados 20.20958
Inicialmente podra pensarse que la estimacin grafica seria la que tuviera un error ms elevado,
pero no ha sido as. De todas formas, debido a su variabilidad, las estimaciones de los parmetros por
este mtodo podran dar cualquier resultado, siendo su MSE poco predecible. Por tanto, para los
valores y la cantidad de observaciones (80) se ha propuesto como los parmetros que provienen del
estudio de estimacin por momentos MOM como los ms acertados para la distribucin de
Lognormal.
En resumen el orden de los mtodos basados en su exactitud para esta aplicacin y con las
funciones y aplicaciones realizadas en R, seria:
Mtodo de los Momentos - MOM
Mtodo de Mxima Verosimilitud MLE.
Mtodo de Mnimos Cuadrados LSM.
Mtodo grfico.
IV.49
CaptuloIV.ResultadosyAnlisis
este caso es Multiple R-squared = 0.9812, por tanto el estadstico R2 indica que el modelo ajustado
explica 98.12% de la variabilidad en Y.
Si suponemos que los datos proceden de un modelo de regresin simple de la forma yi= 0 + 1 xi
+ i, i=1,,n, donde los errores aleatorios i son independientes con distribucin normal de media 0
y varianza 2.
Bajo este modelo,
Loserrorestpicos de los estimadores de los parmetros 0 y 1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores son 0.02178 y 0.011
respectivamente.
La columna t value contiene el estadsticot, es decir, el cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes H0: 0 = 0 y Ha: 1
0. Los correspondientes p-valores aparecen en la columna Pr(>|t|).Puesto que el P-value es
menor que 0.05, existe una relacin estadsticamente significativa entre yy x con un nivel de
confianza del 95.0% para :
i 0 .3
y 1 1 y x ln t
n 0 .4
Call:
lm(formula = Y(RM) ~ X, data = tabla1)
Residuals:
Min 1Q Median 3Q Max
-0.43267 -0.12785 0.02604 0.09813 0.31219
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.99771 0.02178 -45.8 <2e-16 ***
X 0.70135 0.011 63.74 <2e-16 ***
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
IV.50
CaptuloIV.ResultadosyAnlisis
Pearson'sproduct-momentcorrelation
data: tabla1$X and tabla1$Y.RM.
t = 63.7386, df = 78, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.9852459 0.9939355
sample estimates:
cor
0.990536
IV.51
CaptuloIV.ResultadosyAnlisis
En la tabla 24 se indican los resultados aportados por el test individual procedentes de la librera,
Sim.DiffProc (0.1130335), donde el estadstico es diferente al presentado para ks anteriormente, pero
en ambos casos el estadstico obtenido es menor que el valor de la tabla (0,1521), por lo que no se
puede rechazar la hiptesis de que las observaciones no sigan la distribucin terica. As, mismo el
resultado del p-valor es mayor que el nivel de significancia de 0.05., Por tanto no se puede rechazar
la idea de que los datos provienen de una distribucin Lognormal con 95% de confianza.
Tabla 24. Test de Ajuste de Kolmogorov-Smirnov
IV.52
CaptuloIV.ResultadosyAnlisis
IV.53
CaptuloIV.ResultadosyAnlisis
Como se observa en la figura 86, esta es una funcin es creciente y tiende a 1 cuando el tiempo de
reparacin tiende a . Siendo esta una funcin acumulada de probabilidad crece muy rpidamente,
teniendo aproximadamente un 90% de posibilidad de reparacin en el 1 da. La probabilidad de
ocurrencia de reparacin en un intervalo de tiempo t1 - t2 pata t2 > t1 seria Mt2 -Mt1.
lnt 1.38153
Rr t 1 F t 1
1.28233
En la figura 87 se puede observar como esta funcin decreciente y tiende a 0 cuando t . Esta
funcin representa la probabilidad de que no se haya completado la reparacin de los dispositivos
para un tiempo determinado t en das. La informacin que ofrece esta grafica es similar a la funcin
de mantenibilidad pero en trminos inversos.
IV.54
CaptuloIV.ResultadosyAnlisis
En la figura 89 se muestran cmo aunque parecera seguir una forma lineal, se observa como al
inicio de la grfica cierta curvatura en el sentido de una funcin convexa con derivada decreciente, lo
que explicara la forma decreciente de la funcin tasa de reparacin.
IV.55
CaptuloIV.ResultadosyAnlisis
Var T e 2
2
1 e 1.364902
2
4.3.2.7.8. p-cuantil
La expresin matemtica vendra dada por:
tp e
1.38153 1.28233 2InverseErfc 2 p
IV.56
CaptuloIV.ResultadosyAnlisis
R t Z ee R t
1
2
donde Z
es el cuantil correspondiente a la distribucin normal estndar y
1
2
ee R t Var R t es el error estndar de estimacin del estimador KM de R(t), que se calcula
con la frmula de Greewood de la varianza del estimador KM, el cual viene dado por la expresin
2 dt
Var R t R t j:t j t
nj nj dt
En el apartado 3.3. del Apndice 4, se puede observar el programa realizado en R para el anlisis
no paramtrico con comentarios adicionales.
El estimador de Kaplan-Maier para la funcin de supervivencia es obtenido mediante la librera
Survival de R con la funcin survfit. Esta funcin en su forma ms sencilla, solo requiere un objeto de
supervivencia creado por la funcin Surv, en el cual se captura el tiempo observado de la variable y su
estado (censurado o no).
Presenta los argumentos time y event. El argumento time corresponde al tiempo desde que el
dispositivo entra al estudio, hasta que este presenta la reparacin o censura. El argumento event es
una variable binaria que indica el estatus del tiempo registrado, donde, de forma predeterminada
corresponde a
0 <- si el dato es censurado
1 <- si la reparacin es observado
Debido que no se tiene informacin de datos censurados, se asumir un estudio con datos
completos. Los dispositivos han fallado en el tiempo de control y, por tanto, su estado se representara
por 1 en todos ellos.
IV.57
CaptuloIV.ResultadosyAnlisis
Informacin adicional se puede obtener mediante la funcin summary como se indica en la tabla
26 (en el apartado 2.2. del Apndice 4 se puede observar la tabla completa)
Tabla 26. Informacin del Estimador de Kaplan-Meier
time n.risk n.event survival std.err lower95%CI upper95%CI
0.0104 80 1 0.9875 0.0124 0.96315 1
0.0208 79 2 0.9625 0.0212 0.92087 1
0.0243 77 2 0.9375 0.0271 0.88446 0.9905
0.0417 75 3 0.9 0.0335 0.83426 0.9657
0.0431 72 1 0.8875 0.0353 0.81826 0.9567
0.0486 71 1 0.875 0.037 0.80253 0.9475
0.059 70 2 0.85 0.0399 0.77175 0.9282
0.0625 68 1 0.8375 0.0412 0.75666 0.9183
0.0694 67 3 0.8 0.0447 0.71235 0.8877
0.0764 64 1 0.7875 0.0457 0.69786 0.8771
0.0799 63 1 0.775 0.0467 0.68349 0.8665
0.0833 62 2 0.75 0.0484 0.65511 0.8449
0.0868 60 2 0.725 0.0499 0.62716 0.8228
0.0938 58 2 0.7 0.0512 0.59958 0.8004
0.0972 56 1 0.6875 0.0518 0.58593 0.7891
0.1007 55 1 0.675 0.0524 0.57236 0.7776
IV.58
CaptuloIV.ResultadosyAnlisis
IV.59
CaptuloIV.ResultadosyAnlisis
IV.60
CaptuloIV.ResultadosyAnlisis
IV.61
CaptuloIV.ResultadosyAnlisis
IV.62
CaptuloIV.ResultadosyAnlisis
Las funciones Exponencial y Gamma difieren del patrn mostrado por la funcin de tasa de
reparacin, principalmente la primera, ya que es conocido que la exponencial tiene una tasa de
reparacin constante en el tiempo. La funcin de weibull presenta una un buen ajuste pero no tiende
a cero como la funcin no paramtrica y finalmente la funcin lognormal presenta una grfica muy
ajustada a ambos lados de la funcin y tiende a cero con mayor intensidad que el resto de funciones
y de forma similar a la funcin de tasa de reparacin
IV.63
CaptuloIV.ResultadosyAnlisis
La Funcin de Lognormal y weibull seran las que presentaran un ajuste ms cercano a la funcin
en estudio. Las funciones Gamma y Exponencial difieren de la funcin de estudio principalmente a
partir de los 1.5 das.
Todos los grficos muestran en comn una grfica ptima de ajuste, que sera la distribucin
lognormal.
Las funciones principales resultantes con los parmetros obtenidos, se muestran en las figuras 98-
100.
IV.64
CaptuloIV.ResultadosyAnlisis
IV.65
CaptuloIV.ResultadosyAnlisis
Figura 101. Funcin de Mantenibilidad M(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)
Figura 102. Funcin de no Reparabilidad Rr(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)
IV.66
CaptuloIV.ResultadosyAnlisis
Figura 103. Funcin de Tasa de Reparacin h(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)
Figura 104. Funcin de Tasa de Reparacin Acumulada H(t) Paramtrica (izq.) y Funcin no Paramtrica (der.)
IV.67
CaptuloIV.ResultadosyAnlisis
1 1
E T 1 39.6759 1 56.19593
0.6299
Media o Esperanza Matemtica = E[T] de MTTR:
2
1.38153
1.282332
2 2
E T e
e
0.5715834
4.5. Simulacin
4.5.1. Introduccin
Una vez obtenidos los parmetros para cada distribucin identificada (fiabilidad y mantenibilidad)
se pueden generar valores de la variable aleatoria que siguen dicha distribucin.
As se simulara los diferentes tiempos de hasta el fallo o de reparacin de los dispositivos. Estos
valores sern comparados con las distribuciones identificadas en cada caso mediante grficos Q-Q
para comprobar si el ajuste es adecuado a partir del estudio grafico de posicionamiento de los puntos
con respecto a la recta, siendo por tanto una confirmacin emprica de los anlisis realizados.
dx
f y dy p x dx o f y p x
dy
IV.68
CaptuloIV.ResultadosyAnlisis
Esto permite relacionar una variable aleatoria x de la funcin de distribucin p(x) con la variable
aleatoria y de la funcin de distribucin f(y). Si x es de una distribucin uniforme en [0, 1], entonces p
(x) es constante por lo que se tiene:
dx
f y
dy
Esta relacin dara la variable aleatoria de partida, dada la variable aleatoria final. As que se tiene
que ser capaz de invertir la relacin, y G x .
La dificultad est en la determinacin de y = G(x) dado x = F(y), que puede hacer este problema
potencialmente inviable.
Para el caso de la distribucin de Weibull se puede determinar fcilmente la inversa.
A partir de:
y
x F y fw z dz
0
El proceso comienza con la generacin de la variable aleatoria, x, que proviene de una distribucin
uniforme (en el rango de 0 a 1).
1
A continuacin, se aplica la transformacin anterior y ln 1 x para obtener una nueva
variable aleatoria independiente que tiene una distribucin de Weibull con una media y la varianza
que depende de los valores de forma y escala .
IV.69
CaptuloIV.ResultadosyAnlisis
IV.70
CaptuloIV.ResultadosyAnlisis
Figura 105. Grficos Q-Q para una muestra de 10 Variables Aleatorias de una Distribucin de Weibull
IV.71
CaptuloIV.ResultadosyAnlisis
Figura 106. Grficos Q-Q para una muestra de 20 Variables Aleatorias de una Distribucin de Weibull
IV.72
CaptuloIV.ResultadosyAnlisis
Figura 107. Grficos Q-Q para una muestra de 40 Variables Aleatorias de una Distribucin de Weibull
IV.73
CaptuloIV.ResultadosyAnlisis
PruebadeBondadeAjuste
Tamao Secuencia MSE Estadisticos K-Sp-value Chi-Cuadrado
C-M A-D K-S p-value Acep./Rech.H 0 p-value Acep./Rech.H 0
10 1 2.9215 0.0412 0.3125 0.1739 0.874 A no calculado
10 2 2.5860 0.0627 0.3582 0.1847 0.8251 A no calculado
10 3 2.3635 0.0382 0.2628 0.1864 0.8171 A no calculado
10 4 3.2498 0.0280 0.1858 0.5185 0.005032 R no calculado
10 5 2.5243 0.2364 0.0709 0.2005 0.746 A no calculado
20 1 5.5257 0.0341 0.2493 0.1723 0.5364 A no calculado
20 2 4.0794 0.0638 0.4192 0.2047 0.326 A no calculado
20 3 4.0857 0.0335 0.2938 0.1559 0.6595 A no calculado
20 4 4.8657 0.0325 0.2996 0.1447 0.7439 A no calculado
20 5 4.4608 0.0299 0.2768 0.1357 0.8083 A no calculado
40 1 8.8932 0.1661 0.8964 0.1508 0.2925 A 0.01578 R
40 2 12.0998 0.1209 0.7592 0.1396 0.3812 A 0.18045 A
40 3 9.7822 0.0299 0.2603 0.1223 0.5472 A 0.89260 A
40 4 9.5325 0.0411 0.2924 0.147 0.3209 A 0.25102 A
40 5 8.2751 0.0566 0.3857 0.2781 0.003152 R 0.00002 R
IV.74
CaptuloIV.ResultadosyAnlisis
Si se define X N , , entonces Y e tiene distribucin LN , . Su funcin de densidad
2 x 2
Hacer x z
Tomar y e x
IV.75
CaptuloIV.ResultadosyAnlisis
Figura 108. Grficos Q-Q para una muestra de 10 Variables Aleatorias de una Distribucin Log-Normal
IV.76
CaptuloIV.ResultadosyAnlisis
Figura 109. Grficos Q-Q para una muestra de 20 Variables Aleatorias de una Distribucin Log-Normal
IV.77
CaptuloIV.ResultadosyAnlisis
Figura 110. Grficos Q-Q para una muestra de 40 Variables Aleatorias de una Distribucin Log-Normal
IV.78
CaptuloIV.ResultadosyAnlisis
PruebadeBondadeAjuste
Tamao Secuencia MSE Estadisticos K-Sp-value Chi-Cuadrado
C-M A-D K-S p-value Acep./Rech.H 0 p-value Acep./Rech.H 0
10 1 0.0186 0.0844 0.6038 0.326 0.1906 A no calculado
10 2 8.8178 0.0375 0.2894 0.3549 0.1243 A no calculado
10 3 0.7716 0.0244 0.1995 0.2136 0.6768 A no calculado
10 4 5.0779 0.0335 0.2516 0.2397 0.5373 A no calculado
10 5 1.2820 0.0700 0.3665 0.3272 0.1873 A no calculado
20 1 16.7760 0.0799 0.5661 0.1892 0.4194 A no calculado
20 2 3.6272 0.0306 0.1955 0.1324 0.8299 A no calculado
20 3 9.0524 0.0752 0.4530 0.1731 0.5305 A no calculado
20 4 20.6274 0.0317 0.2176 0.1792 0.4868 A no calculado
20 5 18.9060 0.0661 0.4174 0.277 0.07551 A no calculado
40 1 11.2506 0.0481 0.3622 0.0921 0.8562 A 0.30126 A
40 2 11.9966 0.0420 0.3276 0.108 0.6986 A 0.58874 A
40 3 2.7781 0.0365 0.2740 0.0729 0.9731 A 0.34021 A
40 4 8.0324 0.0527 0.3420 0.1303 0.4666 A 0.54699 A
40 5 19.2480 0.0557 0.4239 0.1101 0.6768 A 0.19253 A
IV.79
CaptuloV.ConclusionesFinalesyLneasdeInvestigacinFuturas
V.2
CaptuloV.ConclusionesFinalesyLneasdeInvestigacinFuturas
V.3
CaptuloVI.ReferenciasBibliogrficas
Al-Fawzan M., 2000, Methods for Estimating the Parameters of the Weibull Distribution, Science
and Technology, Riyadh, Saudi Arabia.
Antonitsin A., 2012, Statistical Methods in Reliability Testing, Ms Thesis, Department of Statistics
and Actuarial Science, Simon Fraser University, Vancouver, Canada
Caldern. B, 2014, Introduccin a la Simulacin,
http://www.aladefe.org/simulacin/index_files/documentos/capitulo3.PDF, Universidad de
Antioquia, Colombia
Cao, R. y Jacome, M.A., 2004, Presmoothed kernel density estimator for censored data, Journal of
Nonparametric Statistics, 16, 289-309.
Condra, L., 2001, Reliability Improvement with Design of Experiments, Second Edition, Marcel
Dekker. New York.
Diez D., Sep. 2014, Survival Analysis in R, http://www.stat.ucla.edu/~david/teac/surv/
Eulalia G.P., 2009, Fiabilidad Industrial, Ediciones UPS.
Garca-Ligero M.J., 2014, Simulacin de Procesos Estocsticos, Master Univ. en Estadstica
Aplicada, UGR, Granada.
Garca-Ligero M.J., Sept. 2014, Simulacin Con R,
http://www.ugr.es/~proman/PDF/Simulacin_R.pdf, UGR, Granada.
Godoy A.M., 2009, Introduccin al Anlisis de Supervivencia con R, TFM. Facultad de Ciencias,
UNA, Mxico.
Griful E, 2004, Fiabilidad Industrial. Ediciones UPC, S.L.
Hermida J. J., 2007, Fiabilidad y Garanta en Procesos de Produccin, ETSII, Universidad de Vigo,
2007.
Jiang R. , Zuo, M.J. y Li, H.-X., 1999, Weibull and Inverse Weibull Models allowing negative weights.
Reliability Engineering and System Safety, No. 66, pp. 227-234.
Jones O.,.Maillardet R., 2009, IntroductIon to Scientific Programming and Simulation using R.,
Taylor & Francis Group, Boca Raton, USA.
Juan Prez A, Garca Martn R., 2007, Ingeniera Industrial, Universitat Oberta de Catalunya,
Barcelona.
Juan Prez A, Serrat C., 2006, Ingeniera Industrial, Universitat Politcnica de Catalunya, Barcelona.
Kalbfleish J., Prentice, R. L., 2002, The Statistical Analysis of Failure Life-time Data. John Wiley &
Sons, Inc.
Kapla E. L., Meier, P., 1958, Nonparametric estimation from incomplete observations, Journal of
the American Statistical Association, 53, 457-481.
V.2
CaptuloVI.ReferenciasBibliogrficas
Karian Z.,.Dudewicz E., 2011, Handbook of Fitting Statistical Distributions with R, Taylor & Francis
Group, Boca Raton, USA.
Knuth, D.E., 1981; The Art of Computer Programming, Volume 2 Seminumerical Algorithms,
Addison-Wesley, Reading Mass., 688 pages, ISBN 0-201-03822-6
Laure M., Dutang Ch, Sep. 2014., Fitting parametric univariate distributions to non censored or
censored data using the R fitdistrplus package, http://cran.r-
project.org/web/packages/fitdistrplus/index.html.
Lawless, J. F., 2003, Statistical Models and Methods for Lifetime Data. John Wiley & Sons, Inc..
Lawless, J., 2000, Statistics in Reliability, Journal of the American Statistical Association, 95, 989-
992.
Lee, E. T., Wenyu Wang, J., 2003, Statistical Methods for Survival Data Analysis. Wiley.
Mallor F., Santos J., 2014, Fiabilidad de Componentes y Sistemas, Universidad pblica de Navarra,
rea de Ingeniera Industrial, Pamplona.
Manzano G., 2011, Mtodos de Inferencia para la Distribucin Weibull: Aplicacin en Fiabilidad
Industrial, TFM, Mster en Tcnicas Estadsticas, Universidad de Vigo, Vigo.
Manzano G., 2013, Anlisis de Fiabilidad. Estudio Terico y Prctico con SPSS, TFM, Mster en
Estadstica Aplicada, Universidad de Granada, Granada.
Meeker W., Escobar, L., 1998, Statistical Methods for Reliability Data. John Wiley & Sons, New
York.
Mosquera J., 2009, Fiabilidad Industrial, EIISS, Universidad del Valle, Mxico.
Nachlas J. A, 1995, Fiabilidad, Isdefe (Publicaciones de Ingeniera de Sistemas).
Naya S., 2013, Fiabilidad estadstica: Estado del arte y nuevo retos, Revista cientfica Alammi, 1,
Jul-Dic, Espaa
Nelson W., 1972, Theory and Applications of Hazard Plotting for Censored Failure Data,
Technometrics. 14, 945-966.
Nelson W., 1982, Applied Lifedata Analysis. John Wiley & Sons, Inc..
Nelson, W., 2003, Recurrent Events Data Analysis for Product Repairs, Disease Recurrences, and
Other Applications. ASA-SIAM Series on Statistics and Applied Probability.
O'Connor P., Practical Reliability Engineering Wiley, 1985.Mtodo F(xi)
Prez R., 2014, Evaluacin de la Fiabilidad y Mantenimiento de Sistemas de Ingeniera, Master
Univ. en Estadstica Aplicada, UGR, Granada.
Pinheiro, J. and Bates, D., 1995, Approximations to the Log-likelihood Function in the Nonlinear
Mixed-Effects Model, Journal of Computational and Graphical Statistics, Vol. 4, No. 1 pp. 12-35.
Prabhakar Murphy , D.N. , Min, X., Jiang, R., 2004, Weibull Models. John Wiley & Sons, Inc..
V.3
CaptuloVI.ReferenciasBibliogrficas
V.4
CaptuloVI.ReferenciasBibliogrficas
V.5
Apndices
Apndices
VI.2
Apndices
VI.3
Apndices
VI.4
Apndices
VI.5
Apndices
VI.6
Apndices
VI.7
Apndices
VI.8
Apndices
VI.9
Apndices
VI.10
Apndices
VI.11
Apndices
VI.12
Apndices
grid()
for (i in 1:5){
lines(x,pnorm(x, mean[i], sd[i], lower=TRUE,log=FALSE), col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de Fiabilidad R(t)=1-F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
mean <- c(3, 3, 3, 3, 3)
sd <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=3, ", sigma,"=0.25")),
expression(paste(, mu, "=3, ", sigma,"=0.5")),
expression(paste(, mu, "=3, ", sigma,"=1")),
expression(paste(, mu, "=3, ", sigma,"=1.5")),
expression(paste(, mu, "=3, ", sigma,"=2")))
plot(range(x),c(0,1.1),type="n",xlab="t", ylab="Fiabilidad R(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,pnorm(x, mean[i], sd[i], lower=FALSE,log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
# funcin de riesgo o tasa de fallo h(t)=f(t)/R(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
mean <- c(3, 3, 3, 3, 3)
sd <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=3, ", sigma,"=0.25")),
expression(paste(, mu, "=3, ", sigma,"=0.5")),
expression(paste(, mu, "=3, ", sigma,"=1")),
expression(paste(, mu, "=3, ", sigma,"=1.5")),
expression(paste(, mu, "=3, ", sigma,"=2")))
plot(range(x),c(0,10),type="n",xlab="t", ylab="Riesgo o Tasa de fallo h(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,(dnorm(x, mean[i], sd[i], log=FALSE))/(pnorm(x,mean[i], sd[i], lower=FALSE,log=FALSE)),
col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
VI.13
Apndices
VI.14
Apndices
VI.15
Apndices
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,(dlnorm(x, meanlog[i], sdlog[i], log=FALSE))/(plnorm(x,meanlog[i], sdlog[i],
lower=FALSE,log=FALSE)), col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de riesgo acumulado H(t)=-log(1-F(t))
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
meanlog <- c(1, 1, 1, 1, 1)
sdlog <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, mu, "=1, ", sigma,"=0.25")),
expression(paste(, mu, "=1, ", sigma,"=0.5")),
expression(paste(, mu, "=1, ", sigma,"=1")),
expression(paste(, mu, "=1, ", sigma,"=1.5")),
expression(paste(, mu, "=1, ", sigma,"=2")))
plot(range(x),c(0,5),type="n",xlab="t", ylab="Riesgo Acumulado H(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,-plnorm(x, meanlog[i], sdlog[i],lower=FALSE,log=TRUE), col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
##########################################################################
# 1.3 Distribucin Exponencial #
##########################################################################
#
# funcin de densidad f(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
VI.16
Apndices
for (i in 1:5){
lines(x,dexp(x, rate[i],log=FALSE), col = colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de distribucin F(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
VI.17
Apndices
x <- seq(0,6,len=1000)
rate <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, lambda, "=0.25")),
expression(paste(, lambda, "=0.5")),
expression(paste(, lambda, "=1")),
expression(paste(, lambda, "=1.5")),
expression(paste(, lambda, "=2")))
plot(range(x),c(0,3),type="n",xlab="t", ylab="Riesgo o Tasa de fallo h(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,(dexp(x, rate[i], log=FALSE))/(pexp(x, rate[i], lower=FALSE,log=FALSE)), col =
colors[i],lwd=2)
}
legend("topright", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
# funcin de riesgo acumulado H(t)=-log(1-F(t))
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,6,len=1000)
rate <- c(0.25, 0.5, 1, 1.5, 2)
colors <- c("black", "blue", "green", "red", "grey")
labels <-c(expression(paste(, lambda, "=0.25")),
expression(paste(, lambda, "=0.5")),
expression(paste(, lambda, "=1")),
expression(paste(, lambda, "=1.5")),
expression(paste(, lambda, "=2")))
plot(range(x),c(0,5),type="n",xlab="t", ylab="Riesgo Acumulado H(t)",
cex.lab = 1.2,cex.main=1,
cex.axis = 0.75)
grid()
for (i in 1:5){
lines(x,-pexp(x, rate[i],lower=FALSE,log=TRUE), col = colors[i],lwd=2)
}
legend("topleft", inset=.05, title ="Parmetros",
labels, lwd=2, lty=c(1, 1, 1, 1, 1), cex =0.9, col=colors, bty="n")
#
#
##########################################################################
# 1.4 Distribucin Weibull #
##########################################################################
#
# Scale(eta) = 1/lambda
#
# funcin de densidad f(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
x <- seq(0,5,len=1000)
shape <- c(0.5, 1, 1.5, 2.5, 3.44)
scale <- c(1, 1, 1, 1, 1)
VI.18
Apndices
for (i in 1:5){
lines(x,pweibull(x,shape[i], scale[i], lower=TRUE,log=FALSE), col = colors[i],lwd=2)
}
VI.19
Apndices
VI.20
Apndices
VI.21
Apndices
VI.22
Apndices
VI.23
Apndices
VI.24
Apndices
VI.25
Apndices
4.2. Fiabilidad
#
##########################################################################
# Fiabilidad - Aplicacin prctica #
##########################################################################
#
##########################################################################
# Preparacin de los datos #
##########################################################################
#
setwd("E:/11_Master Estadstica/4_Asignaturas/2_Trabajo Fin Master/0_Practica")
#
datos <- read.table("TFM 2014 Datos.txt", header=TRUE, sep="\t", na.strings="NA",
dec=".", strip.white=TRUE)
datos
names(datos)
#
TTF <- datos[,1]
TTR <- datos[,2]
time<-TTF
#
#
##########################################################################
## 2. Anlisis de Fiabilidad ## #
##########################################################################
#
time
#
##########################################################################
# 2.1 Anlisis exploratorio de datos #
##########################################################################
#
# 2.1.1 Estadsticas bsicas
# Medidas de centralizacin
summary(time)
mode=function(r1){
q=table(r1)
q=sort(q,TRUE)
return(q[1])}
mode(time)
range=function(r2){
range<-max(r2)-min(r2)
out<-list(range=range, min=min(r2),max=max(r2))
return(out)
}
range(time)
quantile (time)
#
# Medidas de dispersin
var (time)
sd(time)
VI.26
Apndices
VI.27
Apndices
#
# 2.2.1.1. Estimador de Kaplan-Meier
# La informacin del estimador de Kaplan-Meier para la funcin de supervivencia
# es obtenida de la siguiente forma
survfit(Surv(db$time, db$event)~ 1,type="kaplan-meier",
conf.type="none")
#
# Informacin adicional con la funcin summary
KM <- survfit(Surv(db$time, db$event)~ 1,type="kaplan-meier",
conf.type="none")
summary(KM)
#
# Obtener la informacin dada por summary en tiempos especficos,
time1 <- c(0,1,2,5,10,20,40,100,150,200)
summary(KM,time1)
#
# Atributos del objeto survfit
names(KM)
#
# Obtener los tiempos de fallo
summary(KM)$time
#
# Obtener los datos de supervivencia de los tiempos de fallo
summary(KM)$surv
#
# 2.2.1.2. Grafica de la funcin de supervivencia
# Se usa el argumento conf.int = F debido a que no se desea que muestre
# el intervalo de confianza estimado para la funcin de supervivencia
plot(KM,conf.int=F, main = "Funcin de supervivencia",
xlab= "Tiempo de Supervivencia (Das)",ylab="Probabilidad de Supervivencia",lwd=2,
col ="blue",xaxt="n", yaxt="n")
box(lwd=1.8, col = 'black')
axis(1, at=seq(0,400,by=50), labels=seq(00,400,by=50),cex.axis=.75 )
axis(2, at=seq(0,1,by=.1), labels=seq(0,1,by=.1),cex.axis=.75 )
abline(h = seq(0,1,.1), v = seq(0,400,25),lty=3,lwd=1,
col ="grey")
legend(200,0.9,c("Funcin de supervivencia"),lwd=2,lty=1,
col="blue", cex =.75, bty="n")
#
#
# 2.2.1.3. Intervalo de confianza para la funcin de supervivencia
# Se realiza con el argumento conf.type dentro de la funcin survfit
## La funcin de supervivencia estimada por medio del estimador de
# Kaplan-Meier y su intervalo de confianza
KM.ord <- survfit(Surv(db$time, db$event)~ 1,type="kaplan-meier",
, error="greenwood", conf.type="plain",conf.int=0.95)
KM.ord
# Informacin adicional
summary(KM.ord, conf.type = "plain")
#
# Intervalo de confianza con la funcin de Supervivencia estimada
plot(KM.ord, main = "Funcin de supervivencia", xlab= "Tiempo de Supervivencia (Das)",
VI.28
Apndices
VI.29
Apndices
grid()
legend(200,.2,
legend=c(expression(paste("Funcin de Distribucin")),
expression(paste("Intervalo de Confianza"))),
col=c("blue", "green", "green"),cex = 0.75,
lwd=1.8,lty=c(1,3,3),bty="n")
#
#
##########################################################################
# 2.2.3. Funcin de Riesgo Acumulado #
##########################################################################
#
# se utiliza como argumento de la funcin plot, fun = "cumhaz "
# Se usa el argumento conf.int = T debido a que se desea que muestre
# el intervalo de confianza estimado
KM1 <- survfit(Surv(db$time, db$event) ~ 1, type="kaplan-meier",
conf.type="log",conf.int=0.95)
plot(KM1, lty=c(1,3,3), fun="cumhaz", conf.int=T,
main = "Funcin de Riesgo Acumulado con Intervalos ",
xlab="Tiempo de Fallo (Das)", ylab="Riesgo Acumulado",lwd=1.7,
col="blue", cex =0.9,cex.axis=.75)
mtext("Mtodo de Kaplan-Meier - IC de 95%", side=3, cex=1)
grid()
legend(200,.9,
legend=c(expression(paste("Funcin de Riesgo Acumulado")),
expression(paste("Intervalo de Confianza"))),
col=c("blue", "blue", "blue"),cex = 0.7,
lwd=1.8,lty=c(1,3,3), bty="n")
#
#
## Comparativa de la Estimacin de la Funcin de Riesgo Acumulado
# La funcin de riesgo acumulado y la funcin
# de supervivencia estn relacionadas para datos continuos
# de la siguiente forma S(t) = exp {-H(t)}.
# Esto ofrece un mtodo de estimacin inmediata de h(t)
# haciendo logaritmos a ambos lados H(t) = -logS(t).
# Un segundo mtodo de estimacin de H(t) es usando el estimador
# de Nelson-Aalen y su varianza
#
# Opcin 1: Mediante -log S(t)(H.hat)
# No hay una funcin directa que realice el clculo en el paquete
# "survival", pero si puede ser realizado usando la salida de survfit():
H.fit <- summary(survfit(Surv(db$time, db$event) ~ 1))
#
# Funcin para evitar errores con datos
ldata <- function(v,MAX,MIN){pmin(MAX,pmax(MIN,v))}
H.fit$surv<-ldata(H.fit$surv,MAX=2,MIN=0.0001)
H.hat <- -log(H.fit$surv)
H.hat
H.hat <- c(H.hat, H.hat[length(H.hat)])
#
# Opcin 2: Mediante el estimador Nelson-Aalen (H.tilde)
VI.30
Apndices
VI.31
Apndices
VI.32
Apndices
#
#
##########################################################################
# 2.2.5. Parametrizacion No Paramtrica #
##########################################################################
#
## Parametrizacin Weibull
#
# Hay mltiples maneras de paramtrica una distribucin Weibull.
# La funcin survreg lo realiza en una familia general de escala-localizacin
# que es una parametrizacin diferente a la funcin de rWeibull
# , y a menudo conduce a la confusin.
# scala en survreg = 1/(rweibull shape)
# intercept en survreg = log(rweibull scale)
# Para el log de mxima verosimilitud todas las parametrizaciones
# conducen al mismo valor.
# ejemplo clarificatorio
# y <- rweibull(1000, shape=2, scale=5)
# survreg(Surv(y)~1, dist="weibull")
#
# Los parmetros serian:
# scale = exp(Intercepct) en survreg
# El parmetro de forma es la inversa de la escala de los resultados
# en survreg. shape=1/escala
regr<-survreg(Surv(db$time, db$event)~ 1, dist = "weibull")
regr
scnp=exp(regr$coefficients)
shnp=1/regr$scale
scnp
shnp
#
x<-db$time
# par(mfrow = c(1,1))
# La Funcin de Supervivencia
curve(exp(-(x/scnp)^(shnp)), from=0,to=400,
main="Funcin de Supervivencia", ylab=expression(hat(S)(t)),
col="darkred",xlab="Tiempo de Supervivencia (Das)", lwd=2, ylim=c(0,1),cex.axis=.75)
leg<-as.factor(paste(c("shape =","scale ="),
c(round(shnp,3),round(scnp,3))))
legend(200,0.8, levels(leg), lwd=0.0001, lty=NULL, cex=.75,bty="n")
#
# Funcin de Riesgos
curve((shnp/scnp)*(x/scnp)^(shnp-1), from=0,to=400,
main="Funcin de Riesgo", ylab=expression(hat(h)(t)),
col="darkblue",xlab="Tiempo de Fallo (Das)", lwd=2,cex.axis=.75)
leg<-as.factor(paste(c("shape =","scale ="),
c(round(shnp,3),round(scnp,3))))
legend(200,0.03, levels(leg), lwd=0.0001, lty=NULL, cex=.75,bty="n")
VI.33
Apndices
VI.34
Apndices
##########################################################################
# 2.3 Anlisis Paramtrico #
##########################################################################
#
##########################################################################
# 2.3.1. Anlisis Grfico #
##########################################################################
#
# Teniendo unas observaciones de una distribucin
# desconocida, se comparan con distribuciones conocidas
# para el ajuste de sus datos
#
# 2.3.1.1. Grficos de probabilidad o Q-Q
# Ajuste grafico de distribuciones de probabilidad o Q-Q
# instalacin de paquetes
# install.packages("MASS")
# install.packages("car")
library(MASS)
library(car)
library(splines)
library(survival)
library(fitdistrplus)
#
# En la funcin "fitdistr", los parmetros de la distribucin terica univariante
# son fijados libremente, realizndose por mxima verosimilitud.
# La funcin qqPlot () crea un grfico cuantil-cuantil
# para cualquier distribucin terica.
#
par(mfrow = c(3,2))
norm.fit <- fitdistr(time, "normal")
qqPlot(time, dist = "norm",
mean = norm.fit$estimate["mean"],
sd = norm.fit$estimate["sd"],
main="Q-Q Plot para una Distribucin Normal",
xlab="Quantiles de una Distribucin Normal",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue" )
#
lnorm.fit <- fitdistr(time, "lognormal")
qqPlot(time, dist = "lnorm",
meanlog = lnorm.fit$estimate["meanlog"],
sdlog = lnorm.fit$estimate["sdlog"],
main="Q-Q Plot para una Distribucin Log-Normal",
xlab="Quantiles de una Distribucin Log-Norma",
ylab="Quantiles de los Datos", line="quartiles", envelope=FALSE,
pch=21,lwd=1.9,cex=0.75,col="blue")
#
fexp.fit <- fitdistr(time, "exponential")
qqPlot(time, dist = "exp",
rate = fexp.fit$estimate["rate"],
main="Q-Q Plot para una Distribucin Exponential",
VI.35
Apndices
VI.36
Apndices
#
#Realizacin de funcin para el clculo de parmetros y bondad
# de ajuste K-S
#
fitData <- function(data, fit="gamma", sample=0.5){
distrib = list()
numfit <- length(fit)
results = matrix(0, ncol=6, nrow=numfit)
for(i in 1:numfit){
if((fit[i] == "gamma")|
(fit[i] == "poisson")|
(fit[i] == "weibull")|
(fit[i] == "exponential")|
(fit[i] == "lognormal")|
(fit[i] == "normal")
)
distrib[[i]] = fit[i]
else stop("Suministrar una distribucin vlida para el ajuste
de los datos" )
}
# Tomar la muestra del conjunto de datos
n = round(length(data)*sample)
data = sample(data, size=n, replace=F)
for(i in 1:numfit) {
if(distrib[[i]] == "gamma") {
gf_shape = "gamma"
fd_g <- fitdistr(data, "gamma")
est_shape = fd_g$estimate[[1]]
est_rate = fd_g$estimate[[2]]
Log_Likelihood = fd_g$loglik
VI.37
Apndices
est_shape = fd_w$estimate[[1]]
est_scale = fd_w$estimate[[2]]
Log_Likelihood = fd_w$loglik
VI.38
Apndices
return(results)
}
# Comparacin de datos con diversas distribuciones, Obteniendo K-S Stat
Aj <- fitData(time, fit=c("lognormal", "normal", "exponential",
"weibull", "gamma", "poisson"), sample=1)
#
colnames(Aj) = Aj[1, ] # la primera fila ser la cabecera
Aj = Aj[-1, ] # eliminar primera fila.
Aj1<-Aj[order(Aj[, 5]),]
Aj1
Aj2<-Aj[order(Aj[, 4]),]
Aj2
#
#
##########################################################################
# 2.3.1.3. Estimacin Grafica Paramtrica #
##########################################################################
#
# Se realizara la estimacin grafica de los parmetros de la distribucin
# Weibull, se comprobara el ajuste por el mtodo de regresin lineal
# mnimo-cuadrtica y analizara grficamente el ajuste
#
## Proceso de estimacin paramtrica
# Ordenar datos de tiempo
timeSort <- sort(time)
# calcular el nmero de datos
n <- length(time)
# Calcular el RANGO DE MEDIANA.
i <- 1:n
RM <- (i-0.3)/(n+0.4) # Rango de Mediana.
# Valores de (x, y) para el grfico.
Y <- function(d) {y <- log(log(1/(1-d))); y}
X <- log(timeSort)
# Crear tabla de datos.
tabla1 <- data.frame(i,timeSort, RM, X, Y(RM))
# Ajustar recta de regresin, limites de confianza y parmetros
lm1 <- lm(Y(RM)~X, data=tabla1)
# Estimacin Parmetros
sh_lm <- round (coef(lm1)[2], 4)
interc <- round (coef(lm1)[1], 4)
sc_lm <- round (exp(-(interc/sh_lm)), 4)
R2 <- round (summary(lm1)$r.squared, 4)
r <- round (cor(X, Y(RM)), 4)
#
# ## Generar la funcin de distribucin F(t) linealizada
# para la distribucin weibull.
# Para nuevos datos hay que adaptar xlim ().
par(mfrow = c(1,1))
plot (x=timeSort , y = Y(RM), log ="x", axes=F, lwd=2, cex=.75,
type="p", cex.lab =.9 ,
main=" Grfica de Weibull ",
xlim = c(0.1, 400),
VI.39
Apndices
VI.40
Apndices
#
# Evaluacin de residuos
layout(matrix(1:4,2,2))
plot(lm1)
#
#
##########################################################################
# 2.3.2 Estimacin Paramtrica puntual #
##########################################################################
#
##########################################################################
# 2.3.2.1. Estimacin Paramtrica puntual por Mnimos Cuadrados #
##########################################################################
#
# La estimacin fue realizada por razones prcticas en el apartado 2.3.1.3.
# Estimacin Grafica Paramtrica, reproduciremos en esta seccin
# la impresin de los parmetros
#
lm1
flsm <- c(sh_lm, sc_lm)
rlsm <- rbind(c("forma", "escala"),flsm)
colnames(rlsm) <- rlsm[1, ] # la primera fila ser la cabecera
rlsm <- rlsm[-1, ] # eliminar primera fila.
rlsm
#
#
##########################################################################
# 2.3.2.2. Estimacin Paramtrica puntual por Mxima Verosimilitud #
##########################################################################
#
# 2.3.2.2.1. clculo de las estimaciones para observaciones completas
# El paquete fitdistrplus permitir el clculo de los parmetros
# de la distribucin.
# library (fitdistrplus)
fmle <- fitdist(time, "weibull", method="mle")
fmle
#
# El paquete Renext, tambin podra ser utilizado para muestras completas.
# install.packages("evd")
# install.packages("numDeriv")
# install.packages("Renext")
library(evd)
library(numDeriv)
library(Renext)
rmle<-fweibull(time)
rmle
#
# 2.3.2.2.2. clculo de las estimaciones para observaciones con censura
# El paquete STAR permitir calcular mediante la funcin weibullMLE
# las estimaciones por el mtodo de mxima verosimilitud de los parmetros
# de la distribucin Weibull y permitir hacer estas estimaciones tanto
# para muestras completas como para muestras con censura tipo II.
VI.41
Apndices
# install.packages("STAR")
library(STAR)
# En el caso de muestras completas se definir "si" como
# numeric(length(yi))+1, que es el valor por defecto, pero en el
# caso de muestras censuradas tipo II, se reordenara la muestra con
# el comando sort y se definir "si" como c(rep(1,r),rep(0,n-r)),
# por lo que se tendr una muestra ordenada con r datos no censurados
# y n-r datos censurados.
wmle<-suppressWarnings(weibullMLE(time,
si=numeric(length(time))+1,shape.min=0.1,shape.max=5))
wmle$estimate
#
##########################################################################
# 2.3.2.3. Estimacin Paramtrica puntual por Momentos #
##########################################################################
#
# Mediante la funcin pelwei del paquete lmon es posible el clculos de los
# parmetros de la distribucin mediante el mtodo de momentos. Con la
# indicacin de bound=000, el clculo se realiza forzando el parmetro de
# localizacin a 0.
# install.packages("lmom")
library(lmom)
lmom <- samlmu(time, nmom=2)
# Para una distribucin weibull
pelwei(lmom ,bound=000)
#
#
##########################################################################
# 2.3.3 Estimacin Paramtrica por Intervalos #
##########################################################################
#
##########################################################################
# 2.3.3.1. Estimacin Paramtrica para Intervalos por Mnimos Cuadrados #
##########################################################################
#
# la estimacin por intervalos proporciona un intervalo dentro del cual hay
# una alta probabilidad (nivel de confianza) de que est contenido
# el verdadero valor del parmetro.
# library(car)
# el parmetro de forma y escala (scale) tendrn los siguientes valores para
# unos intervalos de confianza al 95%
ic<-confint(lm1, level=0.95)
ic
sh_lm_L<-round (ic[2,1], 4)
sh_lm_U<-round (ic[2,2], 4)
sc_lm_U <- round (exp(-(ic[1,1]/sh_lm)), 4)
sc_lm_L <- round (exp(-(ic[1,2]/sh_lm)), 4)
lsmi <- cbind(sh_lm, sh_lm_L, sh_lm_U,sc_lm, sc_lm_L, sc_lm_U)
rlsmi <- rbind(c("shape","shape_2.5%", "shape_97.5%", "scale", "scale_2.5%",
"scale_97.5%"),lsmi)
colnames(rlsmi) <- rlsmi[1, ] # la primera fila ser la cabecera
rlsmi <- rlsmi[-1, ] # eliminar primera fila.
VI.42
Apndices
rlsmi
#
# Grafica para intervalos
#
# Intervalos de Confianza y Prediccin con valores originales de X
# (tiempos ordenados)
# X <- log(timeSort)
# lm1 <- lm(Y(RM)~X, data=tabla1)
p_conf1 <- predict(lm1,interval="confidence", level = 0.95)
p_pred1 <- predict(lm1,interval="prediction", level = 0.95)
tabod<-data.frame(X,p_conf1,p_pred1) # Intervalos con valores originales
#
# Intervalos de Conf. y Pred, con nuevos valores de X (extrapolados
# y ms finamente/uniformemente espaciados que los datos originales)
nd <- data.frame(X = seq(0, 4))
p_conf2 <- predict(lm1,interval="confidence",newdata=nd)
p_pred2 <- predict(lm1,interval="prediction",newdata=nd)
tabnd<-data.frame(nd,p_conf2,p_pred2)# Intervalos con nuevos valores
#
# Grfica de recta de regresin con lmites
library(car)
par(mfrow = c(1,1))
scatterplot(tabla1$X,tabla1$Y.RM., reg.line=F,
smooth=F, spread=F, boxplots="xy",
xaxp=c(-2.5, 6.5, 9),yaxp=c(-6, 2, 8),
span=.5, axes=T, lwd=1.8, cex=1, cex.lab =1 ,cex.axis = .9,
xlim=c(-2.5,6.5), ylim=c(-6,2),
main=" Grfica de Weibull ",
xlab = "Tiempo de Fallo ( log(t) )",
ylab="Funcin acumulada de fallos (log(log(1/(1-F(t))))",
col="red", pch=21)
abline(lm1) ## recta de regresin
#
matlines(tabod$X,tabod[,c("lwr","upr")],col=2,lty=1,type="l",pch="+")
matlines(tabod$X,tabod[,c("lwr.1","upr.1")],col=2,lty=2,type="l",pch=1)
#
matlines(tabnd$X,tabnd[,c("lwr","upr")],col=4,lty=1,type="l",pch="+")
matlines(tabnd$X,tabnd[,c("lwr.1","upr.1")],col=4,lty=2,type="l",pch=1)
#
legend(3,-3.5,
legend=c(expression(paste("Interv. Conf./Pred. val. orig. de t")),
expression(paste("Interv. Conf./Pred. val. nuevos de t"))),
col=c("red", "blue"),cex = 0.7,
lwd=1.8,lty=c(2,2),bty="n")
#
#
##########################################################################
# 2.3.3.2. Estimacin Par. para Intervalos por Mxima Verosimilitud #
##########################################################################
#
# Obtencin de los intervalos de confianza basados en el test de
# razn de verosimilitudes para los parmetros de la distribucin
VI.43
Apndices
VI.44
Apndices
#
#
cpar<-function(time,shape=1,scale=1 )
{ timeSort <- sort(time)
n <- length(time)
i <- 1:n
RM <- (i-0.3)/(n+0.4) # Rango de Mediana .
Frm <- RM
Fhrm <- 1-exp(-((timeSort/scale)^shape))
Fi<-(Fhrm-Frm)^2
Fi<-data.frame(Fi)
MSE<-sum(Fi, na.rm=TRUE)
tabla=cbind(i,timeSort,Frm,Fhrm,Fi)
MSE = cbind(MSE)
print(tabla)
print(MSE)
}
cpar(time,shape= 0.6604795 , scale= 41.0085335 )
#
#
##########################################################################
# 2.3.5. Test de Bondad de ajuste a una distribucin #
##########################################################################
#
##########################################################################
# 2.3.5.1. Test de Bondad para estimacin por Mnimos Cuadrados #
##########################################################################
#
# Evaluacin de resultado de la regresin
summary(lm1)
# Anlisis de varianza del modelo de regresin lineal
# Estudio de la relacin lineal entre ambas variables
anova(lm1)
# Test de independencia lineal y correlacin lineal r
cor.test(tabla1$X, tabla1$Y.RM., alternative="two.sided", method="pearson")
#
#
##########################################################################
# 2.3.5.2. Test de la Bondad mediante estadsticos #
##########################################################################
#
# 2.3.5.2.1. Aplicacin Conjunta de diversos Test
# Mediante la funcin gofstat del paquete fitdistrplus se realiza
# la estimacin de la bondad de ajuste para distribuciones continuas mediante
# los estadsticos de Cramer-von Mises, Kolmogorov-Smirnov y Anderson-Darling.
#
# Para conjunto de observaciones de n > 5 y distribuciones continuas,
# los test de Cramer-von Mises y Anderson-Darling se realizan sin conocimiento
# de los parmetros de la distribucin. El resultado ser la decisin de rechazar
# o no la distribucin terica con un nivel de significancia de 0.05.
# Ambos test se realizan por mxima verosimilitud
#
VI.45
Apndices
VI.46
Apndices
VI.47
Apndices
VI.48
Apndices
4.3. Mantenimiento
#
##########################################################################
# Fiabilidad y Mantenibilidad - Aplicacin practica #
##########################################################################
#
##########################################################################
# Preparacin de los datos #
##########################################################################
#
setwd("E:/11_Master Estadstica/4_Asignaturas/2_Trabajo Fin Master/0_Practica")
#
datos <- read.table("TFM 2014 Datos.txt", header=TRUE, sep="\t", na.strings="NA",
dec=".", strip.white=TRUE)
datos
names(datos)
#
TTF <- datos[,1]
TTR <- datos[,2]
time<-TTR
#
#
##########################################################################
## 3. Anlisis de Mantenibilidad ## #
##########################################################################
#
time
#
##########################################################################
# 3.1 Anlisis exploratorio de datos #
##########################################################################
#
# 3.1.1 Estadsticas bsicas
# Medidas de centralizacin
summary(time)
mode=function(r1){
q=table(r1)
q=sort(q,TRUE)
return(q[1])}
mode(time)
range=function(r2){
range<-max(r2)-min(r2)
out<-list(range=range, min=min(r2),max=max(r2))
return(out)
}
range(time)
quantile (time)
#
# Medidas de dispersin
var (time)
sd(time)
VI.49
Apndices
VI.50
Apndices
VI.51
Apndices
detach ("package:car")
#
par(mfrow = c(1,1))
plot(density(time), main="Distribucin de Densidad"
, ylab="Densidad",lty=1,lwd=2, col ="blue",cex.axis=.75)
grid()
#
#
##########################################################################
# 3.2.1.2. Ajuste analtico Preliminar- Bondad de Ajuste #
# Copyright 2014 worldofpiggy.com (modificada) #
##########################################################################
#
# library(splines)
# library(survival)
# library(fitdistrplus)
# Se usara nuevamente la funcin "fitdistr" para la obtencin
# de los parmetros por mxima verosimilitud y el test de
# Kolmogorov-Smirnov para testear la bondad del ajuste
#
# El parmetro "sample", es el rango de la submuestra (0.5
# significa que el 50% de los datos sern considerados)
#
#Realizacin de funcin para el clculo de parmetros y bondad
# de ajuste K-S
#
fitData <- function(data, fit="gamma", sample=0.5){
distrib = list()
numfit <- length(fit)
results = matrix(0, ncol=6, nrow=numfit)
for(i in 1:numfit){
if((fit[i] == "gamma")|
(fit[i] == "poisson")|
(fit[i] == "weibull")|
(fit[i] == "exponential")|
(fit[i] == "lognormal")|
(fit[i] == "normal")
)
distrib[[i]] = fit[i]
else stop("Suministrar una distribucin valida para el ajuste
de los datos" )
}
# Tomar la muestra del conjunto de datos
n = round(length(data)*sample)
data = sample(data, size=n, replace=F)
for(i in 1:numfit) {
if(distrib[[i]] == "gamma") {
gf_shape = "gamma"
fd_g <- fitdistr(data, "gamma")
est_shape = fd_g$estimate[[1]]
est_rate = fd_g$estimate[[2]]
Log_Likelihood = fd_g$loglik
VI.52
Apndices
VI.53
Apndices
VI.54
Apndices
VI.55
Apndices
#
##########################################################################
# 3.2.2 Estimacin Paramtrica puntual #
##########################################################################
#
##########################################################################
# 3.2.2.1. Estimacin Paramtrica puntual por Mnimos Cuadrados #
##########################################################################
#
# La estimacin fue realizada por razones prcticas en el apartado 3.2.1.3.
# Estimacin Grafica Paramtrica, reproduciremos en esta seccin
# la impresin de los parmetros
#
lm1
flsm <- c(sdlog, mlog)
rlsm <- rbind(c("Desv. Estand", "Media"),flsm)
colnames(rlsm) <- rlsm[1, ] # la primera fila ser la cabecera
rlsm <- rlsm[-1, ] # eliminar primera fila.
rlsm
#
#
##########################################################################
# 3.2.2.2. Estimacin Paramtrica puntual por Mxima Verosimilitud #
##########################################################################
#
# 3.2.2.2.1. clculo de las estimaciones para observaciones completas
# El paquete fitdistrplus permitir el clculo de los parmetros
# de la distribucin.
# library (fitdistrplus)
fmle <- fitdist(time, "lnorm", method="mle")
fmle
#
#
# 3.2.2.2.2. clculo de las estimaciones para observaciones con censura
# El paquete STAR permitir calcular mediante la funcin lnormMLE
# las estimaciones por el mtodo de mxima verosimilitud de los parmetros
# de la distribucin Lognormal y permitir hacer estas estimaciones tanto
# para muestras completas como para muestras con censura tipo II.
# install.packages("STAR")
library(STAR)
# En el caso de muestras completas se definir "si" como
# numeric(length(yi))+1, que es el valor por defecto, pero en el
# caso de muestras censuradas tipo II, se reordenara la muestra con
# el comando sort y se definir "si" como c(rep(1,r),rep(0,n-r)),
# por lo que se tendr una muestra ordenada con r datos no censurados
# y n-r datos censurados.
wmle<-suppressWarnings(lnormMLE(time, si=numeric(length(time))+1))
wmle$estimate
#
##########################################################################
# 3.2.2.3. Estimacin Paramtrica puntual por Momentos #
##########################################################################
VI.56
Apndices
#
# Mediante la funcin pelwei del paquete lmon es posible el clculos de los
# parmetros de la distribucin mediante el mtodo de momentos. Con la
# indicacin de bound=000, el clculo se realiza forzando el parmetro de
# localizacin a 0.
# install.packages("lmom")
library(lmom)
lmom <- samlmu(time, nmom=2)
# Para una distribucin Lognormal
pelln3(lmom ,bound=000)
#
#
##########################################################################
# 3.2.3 Estimacin Paramtrica por Intervalos #
##########################################################################
#
##########################################################################
# 3.2.3.1. Estimacin Paramtrica para Intervalos por Mnimos Cuadrados #
##########################################################################
#
# la estimacin por intervalos proporciona un intervalo dentro del cual hay
# una alta probabilidad (nivel de confianza) de que est contenido
# el verdadero valor del parmetro.
# library(car)
# el parmetro de forma y escala (scale) tendrn los siguientes valores para
# unos intervalos de confianza al 95%
ic<-confint(lm1, level=0.95)
ic
sd_lm_U<-round (1/ic[2,1], 4)
sd_lm_L<-round (1/ic[2,2], 4)
m_lm_L <- round ((ic[1,1]*sdlog), 4)
m_lm_U <- round ((ic[1,2]*sdlog), 4)
lsmi <- cbind(sdlog, sd_lm_L, sd_lm_U,mlog, m_lm_L, m_lm_U)
rlsmi <- rbind(c("sdlog","sdlog_2.5%", "sdlog_97.5%", "mlog", "mlog_2.5%", "mlog_97.5%"),lsmi)
colnames(rlsmi) <- rlsmi[1, ] # la primera fila ser la cabecera
rlsmi <- rlsmi[-1, ] # eliminar primera fila.
rlsmi
#
# Grafica para intervalos
#
# Intervalos de Confianza y Prediccin con valores originales de X
# (tiempos ordenados)
# X <- log(timeSort)
# lm1 <- lm(Y(RM)~X, data=tabla1)
p_conf1 <- predict(lm1,interval="confidence", level = 0.95)
p_pred1 <- predict(lm1,interval="prediction", level = 0.95)
tabod<-data.frame(X,p_conf1,p_pred1) # Intervalos con valores originales
#
# Intervalos de Conf. y Pred, con nuevos valores de X (extrapolados
# y ms finamente/uniformemente espaciados que los datos originales )
nd <- data.frame(X = seq(0, 4))
p_conf2 <- predict(lm1,interval="confidence",newdata=nd)
VI.57
Apndices
VI.58
Apndices
#
#
##########################################################################
# 3.2.4 Comparativa de Mtodos de clculo #
##########################################################################
#
cpar<-function(time, mlog=1, sdlog=1 ){
timeSort <- sort(time)
n <- length(time)
i <- 1:n
RM1 <- (i-0.3)/(n+0.4) # Rango de Mediana .
Frm <- RM1
Fhrm <- qnorm(((log(timeSort)-mlog)/sdlog),mean = 0, sd = 1,lower.tail = T, log.p = F)
Fi<-(Fhrm-Frm)^2
Fi<-data.frame(Fi)
Fi<- Fi[complete.cases(Fi), ]
MSE<-sum(Fi,na.rm=TRUE)
tabla2 <- cbind(i,timeSort,Frm,Fhrm,Fi)
MSE = cbind(MSE)
print(tabla2)
print(MSE)
}
cpar(time, mlog= -1.42255 , sdlog= 1.37678 )
#
#
##########################################################################
# 3.2.5. Test de Bondad de ajuste a una distribucin #
##########################################################################
#
##########################################################################
# 3.2.5.1. Test de Bondad para estimacin por Mnimos Cuadrados #
##########################################################################
#
# Evaluacion de resultado de la regresin
summary(lm1)
# Anlisis de varianza del modelo de regresin lineal
# Estudio de la relacin lineal entre ambas variables
anova(lm1)
# Test de independencia lineal y correlacin lineal r
cor.test(tabla1$X, tabla1$Y.RM., alternative="two.sided", method="pearson")
#
#
##########################################################################
# 3.2.5.2. Test de la Bondad mediante estadsticos #
##########################################################################
#
# 3.2.5.2.1. Aplicacin Conjunta de diversos Test
# Mediante la funcin gofstat del paquete fitdistrplus se realiza
# la estimacin de la bondad de ajuste para distribuciones continuas mediante
# los estadsticos de Cramer-von Mises, Kolmogorov-Smirnov y Anderson-Darling.
#
# Para conjunto de observaciones de n > 5 y distribuciones continuas,
VI.59
Apndices
VI.60
Apndices
#
#
# 3.2.5.2.2. Test Individual de Kolmogorov Smirnov
# Mediante la funcin test_ks_dLognormal del paquete Sim.DiffProc se
# realiza el test de bondad de ajuste de Kolmogorov Smirnov para contrastar si
# un conjunto de datos sigue o no un modelo de distribucin Lognormal.
library(Sim.DiffProc)
ks <-test_ks_dlognorm(time, meanlog=meanlog, sdlog=sdlog)
res <- data.frame(n, meanlog, sdlog, ks[1], ks[2],
row.names = "Resultados" )
res
#
# EL valor del estadstico obtenido de Ks es de 0.1130335 que si se comparara con el
# establecido en la tabla para un nivel de significacin de 5% y una muestra
# de 80 (ir a tabla K-S) D(0.05,80)=1.36/(raiz2(80))= 0.1521.
# Dado que el estadstico (0,0792) es menor que el valor de la tabla(0,1521),
# no se puede rechazar la hiptesis de que las observaciones no sigan
# la distribucin terica.
#
# Donde si el p-valor es mayor que el nivel de significancia de 0.05
# Se puede afirmar que el conjunto de datos sigue una distribucin Lognormal
#
#
##########################################################################
# 3.2.6 Propiedades de Fiabilidad para Distribucin Lognormal #
##########################################################################
#
# 3.2.6.1 Graficas de la distribucin de Lognormal
x <- time
meanlog <- -1.38153
sdlog <- 1.28233
col <- "blue"
labels <-c(expression(paste(, mu, " = -1.38153, ", sigma," = 1.28233 ")))
#
# funcin de densidad f(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
curve(dlnorm(x, meanlog=meanlog, sdlog=sdlog,log=FALSE), xlim=c(0,round(max(x),0)),
type="l",xlab="Tiempo de Reparacin (Das)",
ylab="Densidad f(t)", cex.lab = 1, cex.main=1, cex.axis = 0.75,
col = col,lwd=2)
grid()
legend("right", inset=.05, title ="Parmetros",
labels, lwd=2, lty=1, cex =0.8, col= col, bty="n")
#
# funcin de Mantenibilidad M(t)
par(mgp =c(2,0.5,0), mar=c(4,4,3,2))
curve(plnorm(x, meanlog=meanlog, sdlog=sdlog,lower=TRUE,log=FALSE),
xlim=c(0,round(max(x),0)),
type="l",xlab="Tiempo de Reparacin (Das)",
ylab="Mantenibilidad M(t)", cex.lab = 1, cex.main=1, cex.axis = 0.75,
col = col,lwd=2)
grid()
VI.61
Apndices
VI.62
Apndices
#
##########################################################################
# 3.3. Anlisis no Paramtrico #
##########################################################################
#
# cargar la librera Survival
# install.packages("survival")
library("splines")
library("survival")
#
# la funcin Surv crea un objeto de supervivencia o no reparabilidad en el cual se captura
# el tiempo observado de la variable y su estado (censurado o no)
# Presenta los argumentos time y event. El argumento time corresponde
# al tiempo desde que el sujeto entra al estudio, hasta que este presenta
# la reparacin o censura. El argumento event es una variable binaria que indica
# el estatus del tiempo registrado, donde, de forma predeterminada corresponde a
# 0 <- si el dato es censurado
# 1 <- si la falla es observada
#
# Debido que no se tiene informacin de datos censurados, se asumir un estudio
# con datos completos. Los dispositivos han fallado en el tiempo de control y,
# por tanto, su estado se representara por 1 en todos ellos.
event<-c(rep(1,80))
event
db<-data.frame(cbind(time, event))
db
#
##########################################################################
# 3.3.1. Estimacin de la funcin de supervivencia o no reparabilidad #
##########################################################################
#
# 3.3.1.1. Estimador de Kaplan-Meier
# La informacin del estimador de Kaplan-Meier para la funcin de supervivencia
# indica la probabilidad en cada tiempo t de que el sistema no est
# an reparado. Esta funcin es obtenida de la siguiente forma
survfit(Surv(db$time, db$event)~ 1,type="kaplan-meier",
conf.type="none")
#
# Informacin adicional con la funcin summary
KM <- survfit(Surv(db$time, db$event)~ 1,type="kaplan-meier",
conf.type="none")
summary(KM)
#
# Obtener la informacin dada por summary en tiempos especficos,
time1 <- c(0,.1,.2,.5,1,2,3)
summary(KM,time1)
#
# Atributos del objeto survfit
names(KM)
#
# Obtener los tiempos de reparacin
summary(KM)$time
VI.63
Apndices
#
# Obtener los datos de supervivencia o no reparabilidad de los tiempos de reparacin
summary(KM)$surv
#
# 3.3.1.2. Grafica de la funcin de supervivencia o no reparabilidad
# Se usa el argumento conf.int = F debido a que no se desea que muestre
# el intervalo de confianza estimado para la funcin de supervivencia
plot(KM,conf.int=F, main = "Funcin de no Reparabilidad",
xlab= "Tiempo de Reparacin (Das)",ylab="Probabilidad de no Reparabilidad",lwd=2,
col ="blue",xaxt="n", yaxt="n")
box(lwd=1.8, col = 'black')
axis(1, at=seq(0,5,by=.5), labels=seq(00,5,by=.5),cex.axis=.75 )
axis(2, at=seq(0,1,by=.1), labels=seq(0,1,by=.1),cex.axis=.75 )
abline(h = seq(0,1,.1), v = seq(0,5,.5),lty=3,lwd=1,
col ="gray")
legend(2,0.6,c("Funcin de no Reparabilidad"),lwd=2,lty=1,
col="blue", cex =.75, bty="n")
#
#
# 3.3.1.3. Intervalo de confianza para la funcin de no Reparabilidad
# Se realiza con el argumento conf.type dentro de la funcin survfit
## La funcin de no Reparabilidad estimada por medio del estimador de
# Kaplan-Meier y su intervalo de confianza
KM.ord <- survfit(Surv(db$time, db$event)~ 1,type="kaplan-meier",
, error="greenwood", conf.type="plain",conf.int=0.95)
KM.ord
# Informacin adicional
summary(KM.ord, conf.type = "plain")
#
# Intervalo de confianza con la funcin de no Reparabilidad estimada
plot(KM.ord, main = "Funcin de no Reparabilidad", xlab= "Tiempo de Reparacin (Das)",
ylab="Probabilidad de no Reparabilidad", col=c("blue", "darkmagenta", "darkmagenta"),
lwd=1.8,
lty=c(1,3,3), cex =0.9,cex.axis=.75)
mtext("Mtodo de Kaplan-Meier - IC de 95%", side=3, cex=1)
grid()
legend(2,.6,
legend=c(expression(paste("Funcin de no Reparabilidad")),
expression(paste("Intervalo de Confianza"))),
col=c("blue", "darkmagenta", "darkmagenta"),cex = 0.75,
lwd=1.8,lty=c(1,3,3),bty="n")
#
#
# 3.3.1.4. Comparativa de Estimacin de la funcin de no Reparabilidad
#
# a.- clculo del estimador Nelson-Aalen mediante regresin de cox,
# usando la funcin coxph
aa<- survfit(coxph(Surv(db$time, db$event)~1), type="aalen")
summary(aa)
h.aalen<-(-log(aa$surv))
aalen.est<-cbind(time=aa$time, d=aa$n.event, n=aa$n.risk,
h.aalen, s1=aa$surv)
VI.64
Apndices
#
# b.- clculo del estimador kaplan-meier mediante survival
b<-survfit(Surv(db$time, db$event)~1, type="kaplan-meier")
km.est<-cbind(time=b$time, s2=b$surv)
#
# Generacin de base de datos conjunta
all<-merge(data.frame(aalen.est), data.frame(km.est), by="time")
all
#
# Grafica de comparacin
plot(all$time, all$s1, xlab="Tiempo de Reparacin (Das)",
ylab="Probabilidad de no Reparabilidad",
main="Comparativa de Estimacin de Funcin de no Reparabilidad",
type="s",cex.axis=.75)
points(all$time, all$s1, pch=1)
lines(all$time, all$s2, type="s")
points(all$time, all$s2, pch=3)
legend(2, .6, c("Nelson-Aalen", "Kaplan-Meier"), pch=c(1, 3),cex =0.75, bty="n")
grid()
#
#
##########################################################################
# 3.3.2.Funcion de Mantenibilidad #
##########################################################################
#
# analoga a la funcin de distribucin acumulada,
# la funcin seria M(t)=1-S(t) o fun="event"
#
plot(KM.ord,fun = function(x) 1-x, main = "Funcin de Mantenibilidad", xlab= "Tiempo de
Reparacin (Das)",
ylab="Mantenibilidad Acumulada", col=c("blue", "darkmagenta", "darkmagenta"), lwd=1.8,
lty=c(1,3,3), cex =0.9,cex.axis=.75)
mtext("Mtodo de Kaplan-Meier - IC de 95%", side=3, cex=1)
grid()
legend(2,.6,
legend=c(expression(paste("Funcin de Mantenibilidad")),
expression(paste("Intervalo de Confianza"))),
col=c("blue", "darkmagenta", "darkmagenta"),cex = 0.75,
lwd=1.8,lty=c(1,3,3),bty="n")
#
#
##########################################################################
# 3.3.3. Funcin de Tasa de Reparacin Acumulada #
##########################################################################
#
# se utiliza como argumento de la funcin plot, fun = "cumhaz "
# Se usa el argumento conf.int = T debido a que se desea que muestre
# el intervalo de confianza estimado
KM1 <- survfit(Surv(db$time, db$event) ~ 1, type="kaplan-meier",
conf.type="log",conf.int=0.95)
plot(KM1, lty=c(1,3,3), fun="cumhaz", conf.int=T,
main = "Funcin de Tasa de Reparacin Acumulada con Intervalos ",
VI.65
Apndices
VI.66
Apndices
#
# Dentro del paquete flexsurv, esta la funcin flexsurvreg que crea
# modelos paramtricos para datos de tiempo hasta el suceso
# (no Reparabilidad). Los datos pueden ser censurados por la derecha o
# truncados a la izquierda. Diferentes distribuciones paramtricas
# estn disponibles.
#
# install.packages("flexsurv")
library(muhaz)
library(flexsurv)
#
sLno <- flexsurvreg(Surv(db$time, db$event)~1,dist='lnorm')
sexp <- flexsurvreg(Surv(db$time, db$event)~1,dist="exp")
sWei <- flexsurvreg(Surv(db$time, db$event)~1,dist='weibull')
sgano <- flexsurvreg(Surv(db$time, db$event)~1,dist='gamma')
#
# 3.3.4.1. Funcin de no Reparabilidad (Mantenibilidad)
plot(sWei, type="survival", col.obs="black",
lty.obs=1,lwd.obs=1.9, col="red",
lwd=2, lty=1, cex.axis=.75)
title(main="Funcin de no Reparabilidad", col.main="navy",
xlab="Tiempo de Reparacin (Das)", ylab="Probabilidad de no Reparabilidad",
col.lab="navy", cex.lab=0.9)
VI.67
Apndices
VI.68
Apndices
#
x<-db$time
# par(mfrow = c(1,1))
# La Funcin de no Reparabilidad
curve(plnorm(x, meanlog=meanlog, sdlog=sdlog,lower=FALSE,log=FALSE), from=0,to=4,
main="Funcin de no Reparabilidad", ylab=expression(hat(R)(t)),
col="darkred",xlab="Tiempo de Reparacin (Das)", lwd=2, ylim=c(0,1),cex.axis=.75)
leg<-as.factor(paste(c("sdlog =","meanlog ="),
c(round(sdlog,4),round(meanlog,4))))
legend(2,0.8, levels(leg), lwd=0.0001, lty=NULL, cex=.75, bty="n")
#
# Funcin de Tasa de Reparacin
curve((dlnorm(x, meanlog=meanlog, sdlog=sdlog,log=FALSE))/(plnorm(x, meanlog=meanlog,
sdlog=sdlog,lower=FALSE,log=FALSE)),
from=0,to=4, main="Funcin de Tasa de Reparacin", ylab= expression(hat(h)(t)),
col="darkblue",xlab="Tiempo de Reparacin (Das)", lwd=2,cex.axis=.75)
leg<-as.factor(paste(c("sdlog =","meanlog ="),
c(round(sdlog,4),round(meanlog,4))))
legend(2,4, levels(leg), lwd=0.0001, lty=NULL, cex=.75, bty="n")
#
#La Funcin Acumulada de Tasa de Reparacin
curve(-plnorm(x, meanlog=meanlog, sdlog=sdlog,lower=FALSE,log=TRUE), from=0, to=4,
ylab= expression(hat(H)(t)), main="Funcin Acumulada de Tasa de Reparacin",
col="darkmagenta",xlab="Tiempo de Reparacin (Das)", lwd=2,cex.axis=.75)
leg<-as.factor(paste(c("sdlog =","meanlog ="),
c(round(sdlog,4),round(meanlog,4))))
legend(2,0.8, levels(leg), lwd=0.0001, lty=NULL, cex=.75, bty="n")
#
#
VI.69
Apndices
4.4. Simulacin
4.4.1. Generacin de Variables Aleatorias de una Distribucin Weibull
#
##########################################################################
# 4. Simulacin #
##########################################################################
#
setwd("E:/11_Master Estadstica/4_Asignaturas/2_Trabajo Fin Master/0_Practica")
#
##########################################################################
# 4.1. Simulacin Weibull #
##########################################################################
#
library(MASS)
library(car)
library(splines)
library(survival)
library(fitdistrplus)
library(Sim.DiffProc)
# Se desea simular mediante el mtodo de inversin muestras de 10, 20 y 40
# valores de una distribucin weibull) considerando que t=scale(-log(1-x))^1/shape.
# x es de una distribucin uniforme en [0, 1]
#
# Se realizaran una serie de subfunciones y en el apartado 4.1.5 una funcin conjunta
#
##########################################################################
# 4.1.1. Generacin de datos #
##########################################################################
#
# Funcin de simulacin
fwsim <- function(n, shape, scale)
{
res <- scale*(-log(1-runif(n, 0, 1)))^(1/shape)
#print(results)
print(res)
}
#
##########################################################################
# 4.1.2. Generacin Grafica #
##########################################################################
#
# Generacin Grficos Q-Q
# La funcin qqplot ()) genera grficos Quantile-Quantile plot para
# cualquier distribucin terica.
#
par(mfrow=c(1,1))
fplot <- function(x, dist = "weibull",shape, scale,
mainlab="Q-Q Plot")
{
qqPlot(x, dist = "weibull", shape = shape, scale = scale,
main=mainlab, xlab="Quantiles de Distribucin Weibull",
VI.70
Apndices
VI.71
Apndices
VI.72
Apndices
rep <- i
writeLines("\n \n")
tst <- data.frame( n, rep, row.names = "Simulacin ")
print(tst)
writeLines("\n ")
# Generar datos de simulacin
wsim <- fwsim(n=n, shape=shape , scale=scale)
# Generacin de Grficos
par(mfrow=c(1,1))
plot<-fplot(x=wsim, dist = "weibull",shape, scale,
mainlab=paste("Q-Q Plot para n = ", n, " - ", i))
# prueba MSE (Mean Squared Error)
cpar(x=wsim,shape=shape , scale=shape )
# Bondad de Ajuste - estadsticos
testData(x=wsim,y= "pweibull", shape=shape,scale=scale)
# Test Individual de Kolmogorov Smirnov
kst(x=wsim, shape=shape,scale=scale)
}
}
#
# Declaracin de variables
# set.seed(.01)
i <- 5 # nmero de repeticin
n<- 40 # Cantidad en muestra
shape <- 0.6299
scale <- 39.6759
#
# Ejecucin de funcin conjunta
Sim(i,n=n, shape=shape , scale=scale)
#
#
VI.73
Apndices
VI.74
Apndices
VI.75
Apndices
print(res)
st <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=T)
writeLines("\n Se ACEPTA la hiptesis nula p-valor > 0.05 (nivel de significancia).
Los datos siguen una distribucin de lognormal segn test Kolmogorov Smirnov.")
} else {
res <- data.frame(n, meanlog, sdlog, row.names = "Resultados")
print(res)
st <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=T)
print(res)
writeLines("\n Se RECHAZA la hiptesis nula p-valor < 0.05 (nivel de significancia).
Los datos NO siguen una distribucin de lognormal segn test Kolmogorov Smirnov.")
}
} else {
# test de Chi-cuadrado
tmle <- suppressWarnings(fitdist(x, "lnorm", method="mle"))
chi <- gofstat(tmle,meancount=(4*n)^(2/5),print.test=FALSE)
if (chi$chisqpvalue > 0.05) {
res <- data.frame( n, meanlog, sdlog, chi$chisqpvalue,
row.names = "Resultados")
print(res)
writeLines("\n Se ACEPTA la hiptesis nula p-valor > 0.05 (nivel de significancia).
Los datos siguen una distribucin de lognormal segn test Chi-cuadrado.")
} else {
res <- data.frame(n, meanlog, sdlog, chi$chisqpvalue,
row.names = "Resultados" )
print(res)
writeLines("\n Se RECHAZA la hiptesis nula p-valor < 0.05 (nivel de significancia).
Los datos NO siguen una distribucin de lognormal segn test Chi-cuadrado.")
}
}
}
#
#
# 4.2.4.2. Test Individual de Kolmogorov Smirnov
# Mediante la funcin test_ks_dlnorm del paquete Sim.DiffProc se
# realiza el test de bondad de ajuste de Kolmogorov Smirnov para contrastar si
# un conjunto de datos sigue o no un modelo de distribucin lognormal.
# library(Sim.DiffProc)
kst <- function(x, meanlog,sdlog){
ks<-test_ks_dlognorm(x, meanlog, sdlog)
}
#
#
##########################################################################
# 4.2.5 Funcin conjunta de simulacin para lognormal #
##########################################################################
#
Sim <- function(i,n, min, max, meanlog , sdlog, mainlab){
for(i in 1:i){
rep <- i
writeLines("\n \n")
tst <- data.frame( n, rep, row.names = "Simulacin ")
VI.76
Apndices
print(tst)
writeLines("\n ")
# Generar datos de simulacin
lgsim <- flnsim(n=n, meanlog=meanlog , sdlog=sdlog)
# Generacin de Grficos
par(mfrow=c(1,1))
plot<-fplot(x=lgsim, dist = "lnorm",meanlog, sdlog,
mainlab=paste("Q-Q Plot para n = ", n, " - ", i))
# prueba MSE (Mean Squared Error)
cpar(x=lgsim,meanlog=meanlog , sdlog=meanlog )
# Bondad de Ajuste - estadsticos
testData(x=lgsim,y= "plnorm", meanlog=meanlog,sdlog=sdlog)
# Test Individual de Kolmogorov Smirnov
kst(x=lgsim, meanlog=meanlog,sdlog=sdlog)
}
}
#
# Declaracin de variables
# set.seed(.01)
i <- 5 # numero de repeticin
n <- 10 # Cantidad en muestra
meanlog <- -1.38153
sdlog <- 1.28233
#
# Ejecucin de funcin conjunta
Sim(i,n=n, meanlog=meanlog , sdlog=sdlog)
#
#
#
VI.77