由统计学家J.巴克利[注]和I.詹姆斯[注]于1979年提出。巴克利-詹姆斯估计是一种将最小二乘法推广到因变量数据存在删失情况的参数估计方法。
巴克利-詹姆斯估计假定生存时间()或其简单变换(如对数变换
)与协变量(
)之间呈线性关系,即:
式中为独立同分布的随机变量,均值为0,方差为
;
为
个非删失的生存时间;
、
为最小二乘法待估参数。
由于生存时间存在右删失,只能观察到,其中
为右删失时间。因此式(1)不再适用,通常的最小二乘法也无法估计出该模型的参数,为此巴克利-詹姆斯估计引入了伪随机变量:
式中为表示删失的指标变量。该伪随机变量的意义为:若该观测数据不是右删失数据,取
作为数据;若该观测数据是右删失数据,用
代替
。
对于右删失数据,建议使用下式估计:
式中、
分别为式(1)中
,
的最小二乘估计;
;
为由
构成的卡普兰-迈耶估计;
为
的跳跃值
。
这样就可以用作为因变量进行估计,计算出新的最小二乘估计
,
。由此可以通过迭代法来求解
,
。
巴克利-詹姆斯估计为比例风险模型的改进,故其需满足线性回归模型的使用条件,如线性、方差齐性等。由于巴克利-詹姆斯估计采用的是迭代法,所以可能出现迭代不收敛,或者在多个值之间来回跳跃的情况,此时可以取这些值的平均值作为估计的近似值。