考虑两类分类任务,对数几率回归输出标记,而线性回归模型产生的预测值
是实值,于是我们需要将实值z转换成0/1值。最理想的是“单位阶跃函数”,但是其不连续。因此,我们利用单调可微的对数几率函数去近似单位阶跃函数
对数几率函数是一种“Sigmoid函数”,其将z值转化为一个接近0或1的值,并且其输出值在
附近变化很陡。进一步,将
代入对数几率函数
其可变化为
称为“几率”,反映了作为正例的相对可能性。对几率取对数,则得到“对数几率”
由此可见,这种分类方法实际上是在用线性回归模型的预测结果去逼近真实标记的对数几率,因此,其对应的模型称为“对数几率回归”。这种方法有很多优点,例如它是直接对分类可能性进行建模,无需事先假设数据分布,这样就避免了假设分布不准确所带来的问题;它不是仅预测出“类别”,而是可得到近似概率预测,这对许多需利用概率辅助决策的任务很有用;此外,对数几率函数是任意阶可导的凸函数,有很好的数学性质,现有的许多数值优化算法都可直接用于求取最优解。