INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
1
1. Funciones básicas y distribuciones
1.1 Definición de tiempos de falla
Ø ¿Qué es el análisis de supervivencia?.
Es el análisis estadístico de datos de tiempo a la ocurrencia de un evento
(time to event data), o mejor dicho tiempo entre la ocurrencia de dos
eventos, inicio y fin. Por lo general estos tiempos se conocen como
tiempos de vida, tiempos de supervivencia o tiempos de falla,
dependiendo de la aplicación.
Ø Las posibles aplicaciones del análisis de supervivencia son:
o Biomédicas: tiempos de recuperación de un paciente, tiempos de vida
de pacientes con cierta enfermedad, tiempo en que aparece un tumor,
tiempo de recaída de una enfermedad, etc.
o Industriales: duración de aparatos electrónicos hasta que presentan la
primera falla, duración de un billete, etc.
o Financieros y económicos: períodos de desempleo, pérdida económica
entre dos eventos, etc.
Ø Independientemente de las unidades de medición del “tiempo” (discretas
o continuas). Los datos de tiempo a la ocurrencia de un evento son
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
2
realización de de variables aleatorias no negativas. En este sentido el
análisis de supervivencia se puede entender como el análisis de variables
aleatorias no negativas.
Ø Los tiempos de falla, o de vida, deben de estar determinados de manera
precisa. Es decir, necesitamos definir un evento de origen, una escala de
medición y un evento de fin para cada individuo. El evento de origen no
necesita ocurrir en el mismo tiempo calendario para todos los individuos.
Ejemplos:
o En ensayos clínicos, el evento de origen puede ser la entrada del
paciente al estudio y el evento de fin puede ser la recuperación o a
muerte.
o En aplicaciones industriales, el evento de origen puede ser el momento
de creación del billete o el momento en el que sale a circulación, y el
evento de fin puede ser el momento en el que llega al banco central
como deteriorado, o el momento en el que se decide destruir.
o La escala de medición por lo general es el tiempo real, aunque también
se puede considerar como el tiempo de operación de un sistema, o el
kilometraje de un auto.
Ø Algo que caracteriza al análisis de supervivencia de otros análisis
estadísticos es la presencia de información parcial. Es decir, en algunos
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
3
casos no se conocerá de manera exacta el valor observado de la variable
de interés T, sino que solo se tendrá cierta información parcial. La
información parcial se clasifica en dos tipos: censura y truncamiento. A su
vez estos dos tipos pueden ocurrir por la derecha o por la izquierda.
1.2 Ejemplos de datos de supervivencia
Ø A continuación se presentan algunos ejemplos de datos de supervivencia.
Estos ejemplos fueron obtenidos de Klein & Moeshberger (1997).
Ø EJEMPLO 1: Duración de remisión de un ensayo clínico para leucemia aguda.
Resultados de un ensayo clínico en donde se quería compara la
efectividad de la droga 6-MP versus placebo en 42 niños con leucemia
aguda. El evento de inicio es remisión parcial de la enfermedad después
de haber sido tratados con la droga prednisone. El evento de fin es recaída
o muerte. La escala de medición es tiempo calendario en meses. Algunos
individuos no presentaron el evento de fin al término del estudio. Estos
casos son marcados con un + y son llamados censurados por la derecha.
Más adelante los veremos con detalle.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
4
Ø EJEMPLO 2: Transplante de médula ósea en pacientes con leucemia.
Transplante de médula es un procedimiento estándar en pacientes con
leucemia aguda. La recuperación después del transplante es un proceso
complejo. La prognosis para la recuperación puede depender de factores
que se conocen al momento del transplante, como edad y sexo del
paciente y donador, etapa de la enfermedad inicial, tiempo entre el
diagnóstico y el transplante, etc. La prognosis final depende de cómo
evoluciona el paciente después del transplante. Puede generar aversión o
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
5
rechazo de la medula transplantada (GVHD), que el conteo de plaquetas
se vuelva normal o desarrollar infecciones, etc. El transplante se considera
fracaso cuando el paciente recae o muere.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
6
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
7
Ø EJEMPLO 3: Tiempos de muerte de adultos mayores residentes de un asilo.
Channing House es una casa de retiro en California. Datos con las edades
de muerte de 462 individuos (97 hombres y 365 mujeres) que estuvieron
en la residencia durante el periodo de enero de 1964 y julio de 1975. Se
reportó la edad a la muerte o al momento en que se salían del asilo (en
meses) y la edad a la que los individuos entraron al asilo.
Estos datos son un ejemplo de truncamiento por la izquierda que más
adelante veremos con detalle. Un individuo tiene que sobrevivir lo
suficiente para estar en edad de entrar al asilo. Individuos que mueren
previamente a la edad de retiro son excluidos del estudio.
Ø EJEMPLO 4. Tiempo al primer uso de marihuana. En este estudio a 191
estudiantes de preparatoria se les preguntó: ¿Cuál fue la primera vez que
probaste la marihuana?. Las respuestas fueron, “la edad exacta a la que la
probaron”, “nunca la he probado”, y “la probé pero no recuerdo cuando
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
8
fue la primera vez”. En este último caso tenemos una censura por la
izquierda. El evento de interés ha ocurrido en algún momento previo a la
edad actual del estudiante!.
Ø EJEMPLO 5. Tiempo a desarrollar sida. Se reportan datos con tiempos de
infección y de inducción para 258 adultos y 37 niños que fueron
infectados con el virus del VIH y desarrollaron sida antes del 30 de junio
de 1986. Los datos consisten de los tiempos (en años) desde que adultos
fueron infectados por el virus por transfusión de sangre contaminada, y el
tiempo de espera hasta el desarrollo de sida. Para la población pediátrica,
los niños fueron infectados en útero o al nacer. El tiempo base de
medición es el 1 de abril de 1978.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
9
En este estudio, sólo los individuos que han desarrollado sida antes del
término del estudio son considerados. Individuos que no han desarrollado
sida no son incluidos en el estudio. Este tipo de datos es llamado
truncados por la derecha y más adelante los veremos con detalle.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
10
1.3 La función de supervivencia y la función de riesgo
Ø Como se mencionó anteriormente, el análisis de supervivencia es el
estudio de variables aleatorias no negativas. Sea T una v. a. no negativa
que puede ser discreta o continua.
Ø De los cursos de probabilidad recordamos que toda variable aleatoria T es
caracterizada por su función de densidad f(t) o por su función de
distribución (acumulada) F(t).
Ø Dependiendo si T es una variable aleatoria discreta o continua tenemos la
siguiente relación entre f(t) y F(t)
( ) ( )
=≤=
∑
∫
=
discreta v.a. es T si ,)u(f
continua v.a. es T si ,du)u(ftTPtF
t
0u
t
0 ,
y de manera inversa,
( ) ( )( ) ( )
−−=
discreta v.a. es T si ,tFtF
continua v.a. es T si ,tFdtd
tf ,
donde ( )−tF es un límite por la izquierda definido como
( ) ( )utFlimtF0u
−=−→
.
Ø En análisis de supervivencia existen otras funciones más útiles y más
interpretables que las funciones de densidad y de distribución. Estas son
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
11
la función de supervivencia, denotada por S(t), y las funciones de riesgo
(tasa o intensidad y acumulada), denotadas por h(t) y H(t)
respectivamente.
Ø FUNCIÓN DE SUPERVIVENCIA.
La función de supervivencia S(t) es la función más importante para
describir el comportamiento de tiempos de falla y se define como la
probabilidad de que un individuo sobreviva más allá del tiempo t, es decir,
la probabilidad de que un individuo presente su evento de fin en un
tiempo posterior a t. En notación matemática tenemos,
( ) ( ) ( )tF1tTPtS −=>= .
Ø ¿Cómo se interpreta una función de supervivencia?. Como presentar el
evento de fin no es algo necesariamente bueno, es preferible tener una
probabilidad mayor de que el evento de fin ocurra posterior al tiempo t.
Ø Las funciones de supervivencia pueden diferir en forma, pero todas
mantienen las mismas propiedades básicas:
i. Son monótonas no crecientes,
ii. iguales a uno al tiempo cero y tienden a cero cuando el tiempo tiende
a infinito.
Ø La tasa de decaimiento de las funciones de supervivencia varía de acuerdo
al riesgo de presentar el evento de fin. Eventos más riesgosos presentan
una tasa de decaimiento mayor.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
12
Ø A continuación presentamos una figura con ejemplos de funciones de
supervivencia:
Ø La función de riesgo es una función fundamental en análisis de
supervivencia. Se le conoce también como la tasa de falla condicional en
análisis de confiabilidad, tasa de mortalidad en demografía o función de
intensidad en procesos estocásticos.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
13
Ø Como el tratamiento y la interpretación de la función de densidad es
distinto dependiendo si la v. a. T es discreta o continua, definiremos la
función de riesgo por separado en los casos discreto y continuo.
Ø FUNCIÓN DE RIESGO DISCRETA.
Sea T una v. a. discreta con soporte en { }K,u,u 21 . La función de riesgo
discreta se define como la probabilidad condicional de presentar el evento
de fin en el tiempo t, dado que se ha sobrevivido al tiempo t. Se denota
por h(t). En notación matemática,
( ) ( )tTtTPth ≥== .
o Sea hk la función de riesgo en el tiempo uk, la cual se puede obtener a
través de la función de densidad y de la función de supervivencia como
( ) ( )( )
( )( )1k
k
k
kkk uS
ufuTPuTPuhh
−
=≥=== ,
o Como la función de densidad se expresa en términos de la función de
supervivencia como
( ) ( ) ( )k1kk uSuSuf −= − ,
entonces
( )( )1k
kk uS
uS1h−
−= ,
por lo tanto
( ) ( )( ){ }
( ){ }∏∏
≤≤ −
−==tu:k
ktu:k 1.k
k
kk
h1uSuS
tS .
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
14
o De la misma manera, la función de densidad en términos de la función de
riesgo se obtiene como
( ) ( ){ }∏
<
−=jk
kjj h1huf .
Ø En demografía, la función de riesgo se interpreta como la probabilidad de
morir en el momento t dado que se llegó vivo al tiempo t.
Ø Las funciones de riesgo discretas no tienen ninguna restricción más que
ser no negativas. Las formas que presentan son variadas. A continuación
se presentan algunos ejemplos:
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
15
Ø FUNCIÓN DE RIESGO ACUMULADO DISCRETA.
La función de riesgo acumulado discreta es simplemente la acumulación
de la función de riesgo hasta el momento t y se denota por H(t). En
notación matemática,
( ){ }
∑≤
=tu:kk
k
htH .
Existe una definición alternativa de la función de riesgo acumulado
discreta, la cual obedece a la relación que prevalece en el caso continuo.
Esta es:
( ) ( ){ }
∑≤
−−=tu:k
kk
h1logtH .
Ø En cualquiera de las dos definiciones, las funciones de riesgo acumulado
discretas son funciones monótonas no decrecientes.
Ø FUNCIÓN DE RIESGO CONTINUA.
Sea T una v. a. continua con soporte en [0,∞). La función de riesgo
continua se define como la tasa instantánea de fallo al tiempo t, dado que
se ha sobrevivido al tiempo t. Se denota por h(t) al igual que en el caso
discreto. En notación matemática,
( ) ( )tTtTtP1limth0
≥ε+≤<ε
=→ε
,
la cual puede ser expresada como
( ) ( ) ( )( )
( )( )tStf
tStFtF
limth0
=ε
−ε+=
→ε
o Al observar que ( ) ( )t'Stf −= entonces
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
16
( ) ( )tSlogdtdth −=
al integrar ambos lados tenemos
( ) ( )∫−=t
0
duuhtSlog
finalmente, como S(0)=1 obtenemos que
( ) ( )
−= ∫t
0
duuhexptS
o La función de densidad en términos de la función de riesgo se expresa
como
( ) ( ) ( )
−= ∫
t
0
duuhexpthtf .
Ø La expresión ( )εth se pude ver como la “probabilidad aproximada” de que
un individuo de edad t experimente el evento de fin en el siguiente
instante.
Ø Al igual que en el caso discreto, hay muchas formas para la función de
riesgo. La única restricción es que sea no negativa.
o Una función de riesgo creciente implica un envejecimiento natural.
o Una función de riesgo decreciente es menos común pero indica un
rejuvenecimiento.
o Más comúnmente son las funciones de riesgo en forma de “tina de
baño” que representan el riesgo de mortalidad en poblaciones que se
siguen desde el nacimiento.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
17
o Una función de riesgo en forma de montaña representaría el
comportamiento del riesgo de muerte por enfermedad después de un
tratamiento.
Ø A continuación se muestran algunos ejemplos:
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
18
Ø FUNCIÓN DE RIESGO ACUMULADO CONTINUA.
La función de riesgo acumulado continua es la integral hasta el momento t
de la función de riesgo se denota por H(t). En notación matemática,
( ) ( )∫=t
0
duuhtH .
Esta función está relacionada con la función de supervivencia por
( ) ( ){ }tHexptS −= . Si ( ) 0S =∞ , entonces ( ) ∞=∞H .
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
19
Ø Nota: Existe una formulación general de las funciones de supervivencia y
riesgo que engloba a los dos casos continuo y discreto. Para ello se
requiere de conocer integrales de Reimann-Stieltjes y de las integrales-
producto.
1.4 Algunos parámetros poblacionales
Ø Debido a la presencia de información parcial en el Análisis de
Supervivencia, es conveniente definir algunos parámetros de interés en
términos de la función de supervivencia.
Ø MEDIA:
( ) ( ) ( )∑∑∞
=
∞
====µ
1kk
1kkk uSufuTE ,
si T es variable aleatoria discreta, y
( ) ( ) ( )∫∫∞∞
===µ00
dttSdttf tTE ,
si T es variable aleatoria continua. En ambos casos, la última igualdad se
puede obtener con un cambio de variable.
Ø VARIANZA:
( ) ( ) ( )2
1kk
1kkk
2 uSuSu2TVar
−==σ ∑∑∞
=
∞
=
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
20
si T es una v.a. discreta, y
( ) ( ) ( )2
00
2 dttSdttS t2TVar
−==σ ∫∫∞∞
,
Si t es una v.a. continua.
Ø CUANTILES DE ORDEN p:
El cuantil o percentil de orden p de la variable aleatoria T, tp es tal que
( ) ptF p ≥ y ( ) p1tS p −≥ .
Si T es v.a. continua, tp satisface
( ) p1tS p −= .
En particular, el tiempo de vida mediano es t0.5 tal que ( ) 5.0tS 5.0 = .
Ø VIDA MEDIA RESIDUAL:
La vida media residual es un cuarto parámetro que resulta de interés en
análisis de supervivencia. Para individuos de edad x, este parámetro mide
la esperanza de vida que les queda. Se define como,
( ) ( )( ) ( )
( )
( )
( )xS
dttS
xS
dttfxtxTxTExvmr xx
∫∫∞∞
=−
=>−= .
Ø Ejemplos:
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
21
1.5 Algunos modelos paramétricos
Ø Existen varias familias de modelos paramétricos que se usan para el
análisis de tiempos de fallo. Algunos de estos modelos son populares
porque representan de manera adecuada el comportamiento aleatorio de
los fenómenos y otros porque sus parámetros tienen una interpretación
simple.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
22
Ø Dentro de las familias univariadas más importantes están: exponencial,
Weibull, log-normal, log-logistic y gamma.
Ø Alguna veces existe información acerca del proceso de envejecimiento o
del proceso de fallo en la población que sugiere una distribución en
particular, aunque por lo general esta información es muy específica
como para acotar a una sola familia de modelos.
Ø La motivación para usar un modelo en particular es, por lo general,
empírica. Por ejemplo, si se ha demostrado que un modelo describe
satisfactoriamente el comportamiento de los tiempos de fallo en
poblaciones similares a la que se está estudiando.
1) FAMILIA EXPONENCIAL.
Debido a su importancia histórica, a su simplicidad matemática y a sus
propiedades importantes, se presenta primero el modelo exponencial.
o Función de riesgo: Se caracteriza por tener una función de riesgo
constante.
( ) λ=th , t≥0, λ>0
o Función de supervivencia:
( ) tetS λ−= , t≥0
o Función de densidad:
( ) tetf λ−λ= , t≥0
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
23
o Propiedad de pérdida de memoria:
( ) ( )xTPtTxtTP >=>+> ,
i.e., no hay desgaste. Esta es una consecuencia directa de la función de
riesgo constante.
o Parámetros:
( )λ
= 1TE , ( ) 21TVarλ
= ⇒ ( ) 1T.v.c =
( ) ( )λ
==>− 1TExTxTE
( )p1log1tp −λ
−=
• Aunque la distribución exponencial ha sido históricamente muy popular,
la función de riesgo constante es muy restrictiva en aplicaciones en salud
e industria.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
24
2) FAMILIA WEIBULL.
La distribución Weibull es quizás el modelo más utilizado para tiempos de
fallo. Se usa tanto para modelar tiempos de duración de piezas
manufacturadas como para modelar tiempos de aparición de tumores en
medicina.
o Función de riesgo:
( ) 1t th −αλα= , t≥0, α, λ>0
α es un parámetro de forma y λ es un parámetro de escala
o Función de supervivencia:
( ) ( )αλ−= texptS , t≥0
o Función de densidad:
( ) ( )αλ−λα= texptf , t≥0
o Parámetros:
( ) ( ) α−λα+Γ= 111TE , ( ) ( ) ( ){ }[ ] α−λα+Γ−α+Γ= 221121TVar ,
donde ( ) ( ) ( )1 1 −αΓ−α=αΓ
( )α
−
λ−=
1
p p1log1
t
si α−λ=β 1 , entonces β es el cuantil de orden 0.632
independientemente del valor de α. En ingeniería β es llamado la “vida
característica” de la distribución.
• El modelo Weibull es suficientemente flexible para acomodar funciones
de riesgo crecientes (α>1), decrecientes (α<1), o constantes (α=1).
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
25
3) FAMILIA LOG-NORMAL.
La distribución log-normal ha sido popular en el modelado de tiempos de
fallo debido a su relación con el modelo normal. El tiempo de vida T se
dice que sigue una distribución log-normal, si Y=log(T) se distribuye
normal con parámetros µ y σ2. Haciendo el cambio de variable YeT =
obtenemos la distribución log-normal.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
26
o Función de densidad:
( ) ( )
σµ−
−πσ= −−2
1212 tlog21
expt2tf , t≥0, µ∈ℜ, σ2>0
donde µ y σ2 son la media y la varianza de Y=log(T).
La función de supervivencia y de riesgo dependen de Φ(t), la función de
distribución normal estándar.
o Función de supervivencia:
( )
σµ−
Φ−=tlog
1tS , t≥0
o Función de riesgo:
( ) ( ) ( )tStfth = , t≥0
o Parámetros:
( ) ( )2expTE 2σ+µ= , ( ) ( ){ } ( )22 2exp1expTVar σ+µ−σ= ,
( )pp zexpt σ+µ= , donde zp es el percentil de orden p de una variable
normal estándar. En particular µ= et 5.0 .
• La función de riesgo del modelo log-normal es en forma de montaña,
toma el valor de cero al tiempo t=0, crece hasta alcanzar un valor máximo
y luego decrece a cero conforme t→∞.
• Este modelo es criticado porque es decreciente para valores grandes de t,
lo que pareciera improbable en algunas situaciones.
• Este comportamiento ocurre cuando la población es una mezcla de
individuos que tienden a tener tiempos de vida cortos y largos,
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
27
respectivamente. Por ejemplo, tiempo de supervivencia después de un
tratamiento para algunos pacientes de cáncer, donde las personas que
son curadas se convierten en sobrevivientes de periodo largo. Otro
ejemplo es la duración de los matrimonios, donde después de cierto
número de años, el riesgo de disolución del matrimonio por divorcio
decrece.
• A continuación presentamos algunos comportamientos de la función de
riesgo.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
28
4) FAMILIA LOG-LOGÍSTICA.
Una variable aleatoria T se dice que tiene una distribución log-logística, si
su logaritmo Y=logT sigue una distribución logística. La distribución
logística se parece mucho a la normal, con soporte en todos los reales,
pero con expresiones más sencillas.
• La función de densidad logística es,
( ) 2yexp1
yexpyf
σµ−
+σ
σµ−
= , −∞<y<∞
o Función de densidad: Haciendo el cambio de variable YeT = ,
obtenemos la función de densidad log-logística
( )( )2
1
t1
ttf
α
−α
λ+
αλ= , t≥0
con 01 >σ=α y ( ) 0exp >σµ−=λ .
o Función de supervivencia:
( ) αλ+=
t11tS , t≥0
o Función de riesgo:
( ) α
−α
λ+αλ
=t1
tth
1
, t≥0
o Parámetros:
( ) ( ) ( )111 11TE −−α− α−Γα+Γλ=
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
29
απ
απ
λ= α− csc1 , si α>1
( ) ( ) ( ) ( )TE2121TVar 22 −α−Γα+Γλ= α−
( )TE2
csc2 22 −
απ
απ
λ= α− , si α>2
( )
α
−λ=
1
p p1pt .
• El numerador de la función de riesgo es igual a la función de riesgo
Weibull, pero el denominador causa que la función de riesgo cambie de
forma.
• La función de riesgo es monótona decreciente para α≤1, y para α>1 la
función de riesgo crece inicialmente hasta alcanzar un máximo en el
tiempo ( ){ } αλ−α 11 y luego decrece a cero conforme t→∞.
• Esta distribución es similar al modelo Weibull y exponencial por sus
expresiones simples para h(t) y S(t). Su función de riesgo es similar a la de
la log-normal, excepto en el extremo de la cola derecha, pero su ventaja
es la simplicidad de su función de riesgo h(t) y de su función de
supervivencia S(t).
• A continuación presentamos algunos comportamientos de la función de
riesgo.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
30
5) FAMILIA GAMMA.
El modelo gamma tiene propiedades similares al modelo Weibull, sin
embargo no es tan fácilmente tratable matemáticamente.
o Función de densidad:
( )( )
( )texpttf 1 λ−βΓ
λ= −β
β
, t≥0, λ, β > 0
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
31
β es un parámetro de forma y λ es un parámetro de escala.
La función de supervivencia y la función de riesgo no tienen una forma
analítica explícita y dependen de la función gamma incompleta
( )( ) ∫
−−β
βΓ=β
t
0
u1 dueu1,tIg
o Función de supervivencia:
( ) ( )βλ−= ,tIg1tS , t≥0
o Función de riesgo:
( ) ( )( )tStf
th = , t≥0
o Parámetros:
( )λβ=TE , ( ) 2TVar
λβ=
• Al igual que el modelo Weibull, el modelo gamma incluyen al modelo
exponencial como caso particular (β=1), se aproxima a una distribución
normal cuando β→∞ y coincide con una distribución Ji-cuadrada con
ν=2β grados de libertad cuando β es un entero y λ=1/2.
• La función de riesgo es monótona creciente para β>1, con ( ) 00h = y
( ) λ→∞→t
th . Es monótona decreciente cuando β<1, con ( ) ∞=0h y
( ) λ→∞→t
th .
• Cuando β>1, la moda de la distribución es ( ) λ−β= 1t .
• El modelo gamma no es tan usado para modelar tiempos de fallo como
los modelos Weibull, log-normal y log-logístico, sin embargo sí ajusta
algunos comportamiento de manera adecuada.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
32
• A continuación presentamos algunos comportamientos de la función de
riesgo.
6) OTRAS FAMILIAS.
Existen muchos otros modelos paramétricos que se utilizan para
representar el comportamiento de tiempos de fallo. Algunos de estos son:
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
33
o Distribución gama generalizada:
( )( )
( )α−αββ
λ−βΓ
αλ= texpttf 1
( ) ( )βλ−= α ,tIg1tS ,
para α, β, λ >0.
Esta distribución se reduce al modelo exponencial cuando 1=β=α , al
modelo Weibull cuando 1=β , al gamma cuando 1=α , y tiende a una
log-normal cuando ∞→β . Se usa para bondad de ajuste.
o Más familias se pueden encontrar en el siguiente cuadro resumen de
Klein & Moeshberger (1997):
Ø Comentarios finales:
o En el modelo exponencial se cumple que ( ) ttH λ= . Entonces, de
manera empírica podemos verificar el ajuste a una exponencial
graficando H(t) vs. t. La gráfica debe de ser una línea recta que pasa
por el origen con pendiente λ.
o En el modelo Weibull se cumple que ( ) αλ= ttH . De igual manera,
podemos verificar el ajuste a una Weibull graficando logH(t) vs. logt. La
gráfica debe de ser una línea recta con perndiente α y ordenada al
origen logλ.
INSTRUCTOR: LUIS E. NIETO BARAJAS
Curso: Análisis de Supervivencia
34
o Todas las distribuciones aquí presentadas pueden ser modificadas para
que incluyan un parámetro de “umbral” o “tiempo de garantía” γ. Este
parámetro es un tiempo γ≥0 antes del cual un individuo no puede
presentar el evento de fin. Esto se hace definiendo un nuevo tiempo
γ+= T'T , donde T≥0 sigue cualquiera de las distribuciones anteriores.