首页 . 工学 . 控制科学与工程 . 过程控制 . 过程建模方法 . 数据驱动建模

数据驱动建模

/data driven modeling/
条目作者杨马英

杨马英

最后更新 2023-12-28
浏览 164
最后更新 2023-12-28
浏览 164
0 意见反馈 条目引用

以描述样本数据的特征作为建模的主要准则,分析系统变量间的相互关系,从中获得数学模型的方法,是一种黑箱建模技术。

英文名称
data driven modeling
所属学科
控制科学与工程

对于内部机理尚不清楚的生产过程,采用数据驱动来建立预测模型是一种比较好的建模方法。从历史的输入、输出数据中提取有用建模信息,比较符合流程工业的特点,无须了解太多的过程知识。分析模型的主导变量和辅助变量,并构建变量之间的数学关系,是一种通用的、有效的系统建模方法。

数据驱动建模方法可以用于建立生产过程的预测模型和控制模型。以控制模型为例,该方法可利用已知的输入、输出数据,离线或在线学习计算与当前被控变量输出相匹配的控制量,从而获得系统所要求的各种动态或静态品质。数据驱动建模已形成的建模方法包括线性/非线性自回归模型、神经元网络模型、非线性时间序列分析模型、模糊模型、贝叶斯网络模型、偏最小二乘法模型以及基于统计学习的支持向量机模型等。

数据驱动模型的建模步骤是:①在建模时先利用简单的机理分析、专家经验、人工智能以及一些统计理论方法,如相关性分析、主成分分析等,确定输入变量与输出变量之间的关联结构。②利用神经网络、贝叶斯网络、偏最小二乘法、支持向量机等工具实现线性或非线性的预测逼近能力,通过不断训练学习的办法获取输入变量与输出变量之间的函数逼近关系式,建立基于时间序列相关的预测或控制模型。③预测模型建立后,还需要用独立的样本集进行测试,以便确定模型对不可知数据的泛化性。

数据驱动模型是在不同前提条件下建立,没有应用过程机理和专家知识,模型的监测和诊断性能有限,其适用性和鲁棒性有一定局限性,难以应用于机理较为复杂的工业对象。神经网络、贝叶斯网络等模型的泛化性较差,自回归模型只适用于平稳的过程。在诸多数据驱动建模研究方法中,对算法之间的优点进行互补,以增强模型的鲁棒性、适用性和泛化性是重要发展方向。

非线性建模算法的研究热点主要围绕神经元网络、支持向量机、遗传算法、混沌算法等。新兴的混沌模型也是一种基于数据驱动的建模方法,分析研究对象的过程数据,计算表征系统具有混沌性的特征指标,如李雅普诺夫指数、预测熵、关联维数等,确定具有混沌特性的动态过程。混沌模型具有综合考虑研究对象数据特性的优点,但是只能利用较为单一的历史数据建立预测模型,没有丰富的过程数据资源支撑。

基于优化的数据驱动建模技术是在线性规划的研究基础上发展起来的。在优化设计时,非线性规划模型应用较多,非线性规划模型有许多求解算法,包括梯度法、拉格朗日乘数法、罚函数法、广义简约梯度法以及各种改进算法等。许多非线性规划模型都是在求解线性规划的基础上增加一些改进途径,寻找有效的求解策略。

随着大数据的快速发展,海量数据和高速运算能力正促进数据驱动建模技术的快速成长。由于数据驱动建模没有利用过程模型信息和知识,其监测和诊断性能有限,而基于知识的人工智能方法适用于有大量应用经验和工艺知识的建模对象,但通用性差,因此,将数据驱动建模技术和基于知识的人工智能方法相互结合、相互补充、融合应用是过程建模方法发展的一个新趋势。

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!