Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Este math-block forma parte de una serie de 8 documentos relacionados todos ellos con la Fiabilidad
de componentes desde un punto de vista estadístico:
• Conceptos Básicos (I).
• Identificación y descripción gráfica de los datos (II).
• Análisis paramétrico de los tiempos de fallo (III).
• Análisis no paramétrico de los tiempos de fallo (IV).
• Comparación no paramétrica de muestras (V).
• Tests de vida acelerada (VI).
• Modelos de regresión para observaciones censuradas (VII).
• Análisis Probit (Éxito / fracaso) (VIII).
MAPA CONCEPTUAL_________________________________________________
Función de
Supervivencia y Tabla de Superv.
Tasa de Fallos
Fiabilidad (I):
Conceptos Básicos
Exponencial
Weibull
Distribuciones
habituales en fiabilidad
Lognormal
Proyecto e-Math 1
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
INTRODUCCIÓN_____________________________________________________
Muchas de las técnicas que se presentan a lo largo de este trabajo, en especial las no paramétricas,
fueron inicialmente desarrolladas para su uso en estudios médicos y biológicos bajo el nombre
genérico de análisis de supervivencia (comparación de diferentes tratamientos médicos,
determinación de los factores que intervienen en la supervivencia de los peces de un río, etc.).
Así, por ejemplo, en el caso de una avioneta monomotor, será de gran conveniencia conocer la
probabilidad de éste falle en diferentes etapas de su vida (tras 500 horas de funcionamiento, 800
horas de funcionamiento, etc.). El obtener una buena estimación de la fiabilidad del motor, posibilitará
la toma de decisiones racionales acerca de cuándo conviene revisarlo o cambiarlo por otro nuevo.
Hay una característica común a los datos que aparecen en la mayoría de los estudios sobre la
fiabilidad de un dispositivo, y es el hecho de que contengan observaciones censuradas:
supongamos que se lleva a cabo una investigación, de duración predeterminada, para analizar la
efectividad de un nuevo método de producción de bombillas. La variable de interés en este caso sería
el número de días que cada una de las bombillas “sobrevive” (funciona correctamente, sin fallos).
A primera vista, parecería sensato utilizar los métodos estadísticos tradicionales (tanto paramétricos
como no paramétricos) con objeto de describir el tiempo medio de supervivencia y comparar el nuevo
método de producción con los métodos anteriores. Sin embargo, al final de la investigación, es
probable que siga habiendo bombillas que funcionen correctamente, y el investigador no será capaz
de estimar con precisión cuánto tiempo más permanecerán sin fallar.
Para trabajar con este tipo de datos con información parcial no servirán pues los métodos
tradicionales, sino que serán necesarias técnicas específicas como las que presentamos en este
trabajo.
El documento concluye con la presentación de las tablas de supervivencia (un método clásico, no
paramétrico, que permite realizar estimaciones sobre los tiempos de fallo), y de algunas de las
distribuciones teóricas que más se utilizan en el análisis de la fiabilidad como son la exponencial, la
Weibull, y la lognormal.
Proyecto e-Math 2
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
Notación: en lo que sigue, se denotará por T a la variable aleatoria continua que describe los tiempos
de fallo de un determinado dispositivo, i.e.: T = “tiempo transcurrido hasta que se produce el fallo".
Denotando por f(t) a la función de densidad de probabilidad (f.d.p.) de T, y por F(t) a su función de
distribución (f.d.), se cumplirá:
b t dF (t )
P(a ≤ T ≤ b) = ∫ f (t )dt F (t) = P(T ≤ t ) = ∫ f (u)du f (t ) =
a 0 dt
Dado 0 < p < 1, por tp se denotará al cuantil p de F(t), i.e., tp será el menor instante temporal t tal que
F(t) = P( T ≤ t ) ≥ p .
La tasa de fallo puede pues interpretarse como la “velocidad” a la cual se producen los
fallos, i.e.: es una medida de lo propenso que resulta el dispositivo a fallar en función de
su edad.
Proyecto e-Math 3
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
ETAPA VIDA
ÚTIL
T suele seguir
una distrib.
Exponencial o h(t)
Weibull
PERÍODO
INFANTIL
T suele seguir
aprox. una
PERÍODO DE
Tasa de fallo
distrib. Weibull
DESGASTE
T suele seguir
una distribución
Weibull
Tiempo
Así, por ejemplo, muchos automóviles nuevos suelen presentar pequeños defectos de
funcionamiento al poco de comprarse (elevada tasa de fallos inicial). Una vez solventados tales
defectos, es de esperar que el vehículo proporcione un largo y complaciente período de
funcionamiento (baja tasa de fallos intermedia). Mas tarde, conforme pasan los años, el automóvil
se vuelve más propenso a sufrir averías hasta que, finalmente, después de 15 o 20 años,
prácticamente todos los vehículos están inservibles (elevada tasa de fallos final).
Observar que, a partir de la última ecuación, es posible expresar R(t) como función de h(t):
dF (t )
f (t ) dt 1 dR(t ) dR(t )
h(t ) = = =- ⋅ ⇒ h(t )dt = -
R (t ) R(t ) R(t ) dt R(t )
t t
dR(u )
∫ h(u )du = ∫ du = -[log R(u )]0 = - log R(t )
t
0 0
R(u )
de donde:
t
∫
- h(u)du
0
R(t ) = e
Proyecto e-Math 4
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
OBSERVACIONES CENSURADAS______________________________________
Normalmente, los estudios de fiabilidad tienen una duración predeterminada, por lo que no todos los
dispositivos analizados habrán fallado a su conclusión. Por tanto, el investigador sabrá que un cierto
número de dispositivos han “sobrevivido” durante el período de tiempo que ha durado el test, pero
desconocerá el momento exacto en que hubieran fallado si el estudio se hubiese prolongado de
forma indefinida. Este tipo de datos se llaman observaciones censuradas.
Las observaciones de censura por tiempo o de tipo I aparecen al finalizar un test de duración
predeterminada: de los dispositivos “supervivientes” sólo se sabe que no han fallado hasta ese
momento. En este caso, el tiempo de duración del test es fijo, mientras que el número de productos
que fallan es una v.a.
Por contra, las observaciones de censura por fallos o de tipo II aparecen cuando el test continúa
hasta que una proporción predeterminada de dispositivos hayan fallado. Ahora, el número de
productos que fallan es fijo, siendo el tiempo de duración del test una v.a.
Fallo observado
Fallo NO observado
En los gráficos anteriores muestran los dos tipos de censura: en el primero, el experimento
termina cuando se llega al instante t0 ; en el segundo, el experimento termina cuando falla un
determinado porcentaje de dispositivos, en este caso 5.
Por otra parte, cuando la censura ocurre para un t > 0 (siendo t = 0 el instante en que se inicia el
test de fiabilidad) estaremos ante lo que se conoce como censura a la derecha. Podría ocurrir
también que la censura tuviera lugar para t < 0 (censura a la izquierda): por ejemplo, en una
investigación médica sobre el cáncer, se puede saber que el paciente ingresó en el hospital en
una fecha determinada (fecha de inicio del test), y que sobrevivió durante un intervalo temporal
Proyecto e-Math 5
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
definido; sin embargo, probablemente no se conocerá cuándo aparecieron por primera vez los
síntomas de la enfermedad.
Se suele hablar de censura por intervalos o arbitraria para referirse a observaciones que han
sido censuradas tanto a derecha como a izquierda (es decir, de ellas sólo sabemos que entran
en la investigación cuando ésta ya estaba inicializada y salen de la misma, sin haber fallado,
antes de que finalice).
Finalmente, se puede tener censura simple (si el experimento finaliza en el mismo instante para
todos los dispositivos observados), o censura múltiple. Un ejemplo de esta última sería cuando los
pacientes abandonan el hospital en instantes diferentes (bien por estar recuperados, bien por irse a
otro centro, etc.).
En los próximos math-blocks se usará un test χ2 para contrastar la bondad del ajuste propuesto o
para contrastar diferencias entre grupos. Dado que las hipótesis del test serán diferentes según el
contexto en que estemos, también lo serán las conclusiones que se extraigan a partir del p-valor.
Un p-valor es estadísticamente significativo cuando sea menor o igual a una constante prefijada α.
Si así ocurre, se rechazará la hipótesis nula H0 en favor de la hipótesis alternativa H1. La constante α
representa la probabilidad condicional de rechazar la hipótesis nula, a partir de las observaciones, en
el supuesto de que esta hipótesis sea cierta (esto se conoce como error de tipo I). Por tal motivo,
interesa elegir un valor muy pequeño para α.
Proyecto e-Math 6
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
Habitualmente se toma α = 0,05, con lo cual sólo en 5 de cada 100 casos en los que H0 sea cierta
será rechazada. Si se pretende ser aún más exigentes en cuanto a las “evidencias” que se han de
presentar para rechazar la hipótesis nula, se tomará α = 0,01 o bien α = 0,005. Observar, sin
embargo que, si bien escogiendo un α diminuto resulta más improbable un error de tipo I, también
resultará más probable cometer un error de tipo II, i.e.: que la hipótesis nula sea aceptada en las
ocasiones en que ésta sea falsa.
NO rechazar H0 Rechazar H0
p-valor <= α?
2
Así, cuando se use un test χ para contrastar si las observaciones se pueden ajustar mediante una
distribución exponencial (i.e., para contrastar si los datos obtenidos podrían corresponder
“aproximadamente” a una v.a. que siguiese dicha distribución), el test será:
Obtener aquí un p-valor significativo implicará que la distribución utilizada no es buena para ajustar
los datos.
2
Si se recurre a un test χ para contrastar posibles diferencias entre grupos muestrales, las hipótesis
serán:
H0 : El modelo propuesto NO es mejor que el modelo nulo (i.e.: todos los coeficientes son cero)
H1 : El modelo propuesto es significativamente mejor que el nulo (i.e.: no todos los coeficientes
Si el test resulta significativo, se tendrá que al menos una de las variables explicativas del modelo
afecta al valor de la variable dependiente.
Proyecto e-Math 7
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
Uno de los métodos no paramétricos más clásicos y directos para describir la fiabilidad de una
muestra es la tabla de supervivencia, la cual no es más que una tabla de frecuencias mejorada y
ampliada. A partir de ella es posible hacer una primera estimación sobre el comportamiento de la
función de supervivencia S(t), de la función de distribución F(t), de la función de densidad f(t), y de la
tasa de fallo h(t). El análisis del siguiente ejemplo, construido con ayuda de la hoja de cálculo Excel
(ver archivo TablaSup.xls ), permitirá entender su funcionamiento:
Nota: A fin de obtener estimaciones razonables, el número de dispositivos observados habrá de ser mayor de 30.
Dispositivos Estimaciones
Intervalo Inicio Int. Entrantes Censurados En Riesgo Fallados Prob. Fallo Prob. Superv. R(t) f(t) h(t)
1 0,00 65 14 58,0 19 0,3276 0,6724 1,0000 0,0020 0,0024
2 161,36 32 4 30,0 4 0,1333 0,8667 0,6724 0,0006 0,0009
3 322,73 24 4 22,0 0 0,0227 0,9773 0,5828 0,0001 0,0001
4 484,09 20 4 18,0 1 0,0556 0,9444 0,5695 0,0002 0,0004
5 645,45 15 1 14,5 1 0,0690 0,9310 0,5379 0,0002 0,0004
6 806,82 13 3 11,5 1 0,0870 0,9130 0,5008 0,0003 0,0006
7 968,18 9 1 8,5 2 0,2353 0,7647 0,4572 0,0007 0,0017
8 1129,55 6 1 5,5 0 0,0909 0,9091 0,3496 0,0002 0,0006
9 1290,91 5 1 4,5 1 0,2222 0,7778 0,3179 0,0004 0,0015
10 1452,27 3 2 2,0 0 0,2500 0,7500 0,2472 0,0004 0,0015
11 1613,64 1 0 1,0 0 0,5000 0,5000 0,1854 0,0006 0,0031
12 1775,00 1 1 0,5 0 1,0000 0,0000 0,0927 --- ---
0,0025 1,00
Probabilidad
0,0020 0,80
Probabilidad
0,0015 0,60
0,0010 0,40
0,0005 0,20
0,0000 0,00
1 2 3 4 5 6 7 8 9 10 11 1 2 3 4 5 6 7 8 9 10 11
Intervalo Intervalo
1,00 0,0040
Tasa de Riesgo
0,80
Probabilidad
0,0030
0,60
0,0020
0,40
0,0010
0,20
0,00 0,0000
1 2 3 4 5 6 7 8 9 10 11 1 2 3 4 5 6 7 8 9 10 11
Intervalo Intervalo
Proyecto e-Math 8
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
A partir de estos datos, es posible calcular otros estadísticos adicionales que se describen a
continuación:
r
ni′ = ni − i
2
• Probabilidad de fallo: para cada intervalo, es la proporción de observaciones en riesgo que
fallan. En el caso de que un intervalo no registre ningún fallo, se acostumbra a tomar 0,5 en
lugar de 0 a la hora de contabilizar el número de fallos (a fin de “suavizar” las funciones
estimadas):
di
ˆi =
p
n'i
Proyecto e-Math 9
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
La tabla de supervivencia proporciona una visión descriptiva de cómo se distribuyen los tiempos de
fallo. Sin embargo, para poder realizar predicciones probabilísticas será necesario conocer cual es
(aproximadamente) la distribución de la población que subyace tras las observaciones.
Sea T la variable que representa los tiempos de fallo de un determinado dispositivo ( T > 0 ). El
objetivo será conocer (si ello es posible) la función de distribución asociada a T, la cual será de la
forma F( t ; θ) = P( T ≤ t ) , siendo θ un vector de parámetros.
• Parámetro de localización γ: se usa para desplazar una distribución hacia un lado u otro.
Esto significa que, dada una distribución cuyo dominio habitual sea [0 , +∞), la inclusión de un
parámetro de localización γ cambiará el dominio a [γ , +∞). En el caso de la normal, el
parámetro de localización es la media.
Se dice que una v.a. Y pertenece a la familia localización-escala (location-scale) si su f.d. se puede
expresar de la forma:
Observar que Φ es la f.d. de la v.a. Z = (Y - µ)/σ . Muchas de las distribuciones más habituales, o bien
pertenecen a esta familia o bien están íntimamente relacionadas. Ejemplos de distribuciones que
pertenecen a esta familia son la normal, la logística, y la de valores extremos:
y µ
Normal Æ F( y;µ, σ) = Φ nor donde Φnor es la f.d. de una N(0,1)
σ
y µ
Logística Æ F( y; µ, σ) = Φ logis donde Φlogis (z) = exp(z) / (1 + exp(z))
σ
log(t) µ
LogNormal → F(t; µ, σ) = Φ nor
σ
log(t) µ
Log log ística → F(t; µ, σ) = Φ log is
σ
log(t) µ
Weibull → F(t; µ, σ) = Φ ve donde Φve (z) = 1 – exp{-exp(z)}
σ
Proyecto e-Math 10
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
Las distribuciones que más se emplean a la hora de modelar tiempos de fallo, algunas de las cuales
serán comentadas a continuación, son la Weibull, la exponencial, la normal, la log-normal, la logística,
la log-logística, y la de valores extremos.
Distribución Exponencial: se utiliza para modelar el tiempo transcurrido entre dos sucesos
aleatorios no muy frecuentes cuando la tasa de ocurrencia, λ , se supone constante.
En fiabilidad se usa para describir los tiempos de fallo de un dispositivo durante su etapa de vida útil,
en la cual la tasa de fallo es (aproximadamente) constante, i.e.: h(t) = λ . Una tasa de fallo constante
significa que, para un dispositivo que no haya fallado con anterioridad, la probabilidad de fallar en el
siguiente intervalo infinitesimal es independiente de la edad del dispositivo.
La tasa de fallo λ es el parámetro que caracteriza a esta distribución. Este valor es la inversa del
tiempo medio que transcurre hasta el fallo (o entre dos fallos consecutivos, MTBF, si el dispositivo
sigue funcionando), i.e.: α = MTTF = 1/λ . Observar que aquí α es el parámetro de escala, también
llamado vida característica. La f.d.p. de una distribución exponencial es de la forma:
f(t) = λ ⋅ exp{− λ ⋅ t} 0 < t < ∞, λ > 0
0,25 1,0
lamda = 0,250
lam da = 0,250
0,20
0,15
F(t)
f(t)
0,10
lamda = 0,125
0,05
0,00 0,0
0 50 100 0 50 100
t t
1,0 0,25
lamda = 0,250
0,20
S(t)
h(t)
lam da = 0,250
lam da = 0,125
0,15
0,0
0 50 100 0 50 100
t t
Proyecto e-Math 11
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
1 t γ
f(t; α, γ) = exp ,
α α
donde α = 1/λ > 0 es el parámetro de escala, y γ es el parámetro de localización. Notar que cuando γ
= 0 se obtiene la distribución exponencial de un único parámetro.
La Weibull es tan flexible que, eligiendo adecuadamente sus parámetros, permite describir las tres
etapas de la función tasa de fallos (curva de la bañera). Esta distribución viene caracterizada por dos
parámetros: α (escala) y β (forma). Su f.d.p. es:
β t
β −1 t β
f (t) = ⋅ ⋅ exp− 0<t<∞ , α>0 , β>0
α α α
Observar que cuando β =1, basta con tomar α = 1/λ para obtener la f.d.p. de la distribución
exponencial.
f.d.p. f(t) Weibull para escala = 10 f.d. F(t) Weibull para escala = 10
0,15 1,0
forma = 1
forma = 4
0,10 forma = 1
f(t)
F(t)
0,5 forma = 2
forma = 2
0,05
forma = 4
0,00 0,0
0 10 20 0 10 20
t t
Función Supervivencia Weibull para escala = 10 Tasa Riesgo h(t) Weibull para escala = 10
1,0 0,4
forma = 4 forma = 4
0,3
forma = 1 forma = 2
R(t)
h(t)
0,1
0,0 0,0
0 10 20 0 5 10
t t
Proyecto e-Math 12
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
Distribución Lognormal: La f.d.p. de una distribución normal es no nula en todo el eje real (y no
sólo en el semieje positivo). Por este motivo, el uso de la normal implicaría que el fallo puede
producirse antes del instante t = 0. Para evitar esta inconveniencia que presenta la distribución
normal, se puede utilizar en su lugar la distribución Log-normal.
Se dice que una variable aleatoria T sigue una distribución Lognormal (base e), de parámetros γ
(localización) y α (escala), cuando su logaritmo neperiano Y = Log(T) se distribuye de forma normal
con media γ y desviación típica α.
Y
Inversamente, dada una v.a. Y≈N(π,σ), la variable aleatoria T = e seguirá una distribución
Lognormal (base e) de parámetros γ = µ (localización) y α = σ (escala), cuya f.d.p. será:
1 −1
f(t) = ⋅ exp
2
(ln(t) − µ )2 t>0
σ ⋅ t 2π 2σ
sigma = 0,3
1,0 sigma = 1
F(t)
sigma = 0,5
0,5
sigma = 1
0,0 0,0
0 1 2 3 4 5 0 1 2 3 4 5
t t
1,0
sigma = 0,3
4
3
sigma = 0,3 sigma = 0,1
R(t)
h(t)
0,0 0
0 1 2 3 4 5 0 1 2 3 4 5
t t
Proyecto e-Math 13
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
BIBLIOGRAFÍA______________________________________________________
[1] Arsenault, J.E.; Roberts, J.A.(1980): Reliability and maintainnability of electronic systems.
Computer Science Press.
[3] Barlow & Proshan (1981). Statistical theory of reliability and life testing. To begin with.
[4] Breuer, M.A.; Friedman, A.D (1976), Diagnosis and reliable design of digital systems.
Computer Science Press.
[5] García Muñoz R., Quiles Flor F (1992), Fiabilidad y Test de Sistemas. Depto Informática
Albacete, UCLM.
[7] Trivedi (1982). Probability and statistics with reliability, queueing and computer science
applications. Ed. Prentice Hall.
ENLACES___________________________________________________________
[W1] Desde la página de la empresa española ISDEFE podemos bajarnos dos libros de la serie
azul de las monografias. El primero de ellos es Fiabilidad de Joel A. Nachlas.
Proyecto e-Math 14
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
Conceptos básicos de Fiabilidad
[W2] Antonio Ángel Blesa de la Universidad de Las Palmas de Gran Canaria ha elaborado un
excelente Tutorial sobre fiabilidad.
Proyecto e-Math 15
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)