展开全部 +
首页 . 管理学 . 情报学 . 情报研究 . 情报研究方法 . 相关分析方法

主成分分析法

/principal component analysis/
条目作者朝乐门

朝乐门

最后更新 2022-02-09
浏览 362
最后更新 2022-02-09
浏览 362
0 意见反馈 条目引用

在降维的思想指导下产生的一种处理高维数据的方法。

英文名称
principal component analysis
所涉及学科
情报学
应用领域
情报研究

通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。降维思想是把一个多因素问题转化成一个较少因素问题,以此降低问题的维数的方法。

在社会实际问题研究中,往往会涉及众多相关的变量。例如,对全国省会城市和计划单列城市发展水平进行比较,必须选取合适的可直接测量的指标,以综合反映一个城市的综合发展水平。如果从规模、结构、效益、基础设施、城镇化水平、居民消费水平等方面考虑,可选取多项指标,其指标体系构成包括市区人口密度、年末总人口数量、非农业人口数量、建成区面积、人均园林绿地面积、全部就业人口数量、第三产业从业人员比重、国内生产总值、农牧渔业生产值、工业总产值、产品销售收入、利税总额、固定资料投资总额、社会消费品零售总额、人均地方财政收入、人均地方财政支出、人均教育事业费支出、人均储蓄年末余额、职工平均工资、客运总量、货运总量、人均邮电业务总量等。但是,变量太多不仅会增加计算的复杂性,而且也会给合理地分析和预测带来困难。通常在实际问题研究中,虽然所涉及的每个变量都可以提供一定的信息,但其重要性有所不同,且通常变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。信息的重叠越大,变量间的相关性也越大。如何对这些变量加以“改造”,用维数较少的、互不相关的、不可直接测量的新变量来反映原变量所提供的绝大部分信息,并通过对新变量的分析达到解决问题的目的,这正是主成分分析法核心思想之体现。

  • 卢小宾.信息分析概论.北京:电子工业出版社,2014.

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!