一元成分数据回归分为成分数据在模型中作为被解释变量或者作为解释变量两种情形。
被解释变量的一元线性回归模型中可包含一个或多个数值型解释变量。记被解释变量的第个样本点
。
为样本大小。假设模型中共有
个解释变量,均为普通数值型数据。记第
个样本的解释变量观测为
,其中
,对应于回归模型中的截距项。回归模型为:
(1)
其中为回归系数。对于第
个样本,
的估计
可以作为
的函数。类似普通的线性回归模型,模型参数的估计离不开最小化残差平方和(sum of square error,SSE)。这里,残差定义为
,其大小由Aitchison几何中的范数
来计算,因此该模型要最小化的目标函数为:
.
分数据作为解释变量,普通数值型数据作为被解释变量的一元线性回归模型。记成分数据解释变量为,数值型数据被解释变量为
,每个数据点
,与被解释变量的观测
相关联,
。该模型形式为:
(2)
其中,是回归系数,
是实空间的截距项。
是Aitchison内积,内积结果是一个数值。由于被解释变量也是数值,因此可以采用经典最小二乘拟合,相应的模型最小化目标函数为:
.
通常,对于模型(1)和(2)的参数估计可以采用等距对数比变换处理成分数据变量,解除成分数据的定和约束,继而采用经典最小二乘估计模型参数。