数据挖掘技术在烟草设备运行管理中应用探索


1、背景

当前,我国烟草工业企业面临日益激烈的市场竞争,对企业在产品的质量、成本,以及交货期等方面提出越来越高的要求。对于流程工业而言,如果机械设备的某一零部件或设备出现故障而又未能及时发现和排除,或是工艺指标设置错误或实际运转中出现了偏差,其结果不仅可能导致设备本身损坏,而且往往会影响到整个流程生产系统的运行。同时,由于产品的不可逆性,这些异常情况造成的经济损失是非常巨大的[2]。因此,设备运行的管理对于流程工业具有特别重大的意义。

烟草行业属于典型的流程工业。烟草行业设备先进,自动化程度高,进口设备占全部设备的一半左右。中国烟草总公司《烟草工业企业设备管理办法》明确要求“积极采用设备状态监测和现代故障诊断技术,发展以设备技术状态为基础的维修方式”。烟草行业内经常提及的“设备保障工艺、工艺保障质量”,强调的正是设备运行管理对于烟草行业生产的重要意义。

目前,烟草企业装备信息化水平在国内制造业处于较高水平,在管理系统和底层数采系统、状态检测系统中存在大量的数据资源。但在设备运行管理方面的数据资源利用率和数据价值挖掘水平并不高,企业没有真正重视数据利用机制建设,没有进行深入的研究和资源开发,导致大量的资源浪费。

“精益化”和“智能化”是烟草企业精益制造的发展趋势。但是基础的“数据管理”恰恰是行业设备管理的薄弱环节,设备管理者迫切需要具体实用的数据分析工具和方法,运用数据发现和解决具体问题,有效支持决策,改进管理,科学评价。因此规范和加强设备数据管理,建立设备数据的采集、分析、应用找到科学的机制和方法,对卷烟工厂设备管理精益化有着重要意义。

数据挖掘技术是近些年发展起来的新兴学科,随着大数据技术迅速发展,结合大数据算法、计算智能、模式识别、统计学等相关知识,研究积攒下来的历史数据,对数据进行归类、分析、处理,进而挖掘出隐含的有价值的知识,为管理和技术人员提供有效的决策依据[3]。在长期的生产过程中,烟草行业积累了丰富历史数据,这些经验和数据浓缩了企业管理的经验和成果,也为卷烟产品工艺参数和设备管理科学决策提供了有利的前提条件。大数据时代下,如何将数据挖掘技术合理地运用到烟草行业的设备运行管理中是一个亟待解决的问题。针对该问题,本文进行了一些初步的探索和讨论。

2、设备运行数据挖掘技术的发展现状

目前烟草行业的设备运行管理的研究主要围绕着设备的故障诊断和质量工艺缺陷控制展开。故障诊断的相关研究起始于20世纪70年代。虽然时间不长,但是在电路与数字电子设备、机电设备等各个领域已取得了令人瞩目的成就,成为学界的研究热点之一。国内在故障诊断方面的研究起步稍晚,20世纪80年代开始,国内部分高校和科研机构首先在汽车故障诊断领域进行了研究。目前的设备运行管理,主要是基于专家系统完成的。这些专家系统大致可以分为基于规则的专家系统、基于实例的专家系统、基于模糊理论的专家系统和基于行为的专家系统。随着数据的积累和信心技术的不断发展,数据挖掘技术被越来越广泛地应用到设备运行管理专家系统中。

目前,在设备运行管理中被广泛使用的数据挖掘技术主要包括:

2.1 关联规则发现

关联分析就是挖掘数据之间相互依赖的关系。如果从一组属性A推出另一组属性,则说明B依赖于A。相关分析出的结果有时可以作为最终的结论进行决策,但是,依赖关系一般强的反映的是本身固有的特性,无法得到更深层的隐含的特性,自动对依赖关系查找也许是可行的。常用的技术是关联规则、回归分析、信息网络等[4]。在设备运行管理的过程中,通过发现设备状态参数与故障之间的关联规则,我们可以更快和有效地对设备的故障采取预防性措施。例如:山东中烟工业公司在ZJ112卷接机组上对工控系统的实时运行参数进行了长期采集跟踪,与故障现象和异常报警数据之间构成训练数据集,通过关联规则分析,获取故障和质量缺陷与运行参数的关联关系,为精准保养和维修指明了方向,提高维护的效率和科学性。

2.2 决策树方法

在设备自检的过程中,如果考虑的因素过多,可能反而会降低整个过程的效率。找到那些影响设备运行的主要因素,是正确判断设备状态和提高设备运行效率的关键。决策树方法可以解决设备运行管理中的这个问题。决策树也叫做判定树,是一种树状结构,用于分类或预测。决策树是一种归纳式学习算法,属于有监督学习的机器学习方法。根节点是树的最高层节点,是整个决策树的开始,在其内部结点对属性值进行比较,根据属性的不同判别属于结点的哪一个分支,在决策树叶结点得到结论。所以从根结点就对应着一条合取规则,整棵树就对应一组析取表达式规则[5]。部分卷烟工厂利用决策树方法,对故障原因进行深入挖掘,逐步构建智能化的故障诊断决策树,通过实时数据的持续训练,准确度大幅提高,可用性不断提升,取得不错的效果。

2.3 粗糙集方法

粗糙集是一种处理不精确、不确定和不完全数据的数学方法,通过对数据的分析和推理来发现隐含的知识、揭示潜在的规律。粗糙集方法保留基本信息的同时,使其分类能力保持不变,从而消除冗余属性或属性值。粗糙集最主要的特点是:无需提供对知识或数据的主观评价,仅根据观测数据就能达到删除冗余信息,比较不完备知识的程度-粗糙度,界定属性间的依赖性和重要性的目的[6]。粗糙集方法对于专家系统中设备运行状态的判断具有很强的支持。

2.4 神经网络方法

人工神经网络(ANN,ArtifieialNeuralNetwork)是反映人脑结构及其功能的一种比较抽象的一种数学模型,它是由大量的神经元节点相互联成的一个复杂网络,能够模拟人类实现知识的表示和存储以及能够运用知识去进行推理的一种行为。在本质上讲,ANN的学习方式是一种归纳的学习方式,经过大量实例进行反复的学习,由其内部的自适应的过程去不断地修改各神经元的互联的权值,以使神经网络的权值分布能够收敛于一个比较稳定的范围[7]。

神经网络具有很强的鲁棒性、记忆能力、非线性映射能力以及强大的自学习能力,因此非常适合烟草生产流程多干扰、强耦合、非线性以及不确定强的特点。本文基于山东中烟的历史生产数据,训练一个神经网路模型,通过预测加料机的出口水分来对设备状态进行监控,并与真实数据进行比较,从而实现对设备运行的状态进行监控和预测的目的。

3、实例探索

本节主要介绍运用神经网络技术构建加料机出口水分预测模型的工作。首先,对加料机生产信息表进行数据的预处理。剔除表中数值有缺失的记录。同时,对于表中一些语义尚不明确,或是全部被记录为null值的字段,也直接以列为单位删除。经过处理后,我们得到的用于训练神经网络的数据一共195543条。

然后,以加料机的出口水分为神经网络输出层的预测对象,忽略用于标记生产批次以及生产作业时间的信息,最终得到如表1所示的剩余的21个变量构成神经网络的输入层的向量。虽然如后文所示,基于这些变量训练的神经网络已经取得了不错的预测效果,但是在之后的工作中,还需要通过调整输入层的变量来进一步优化神经网络。一方面是由于神经网络模型自身难以解释其推理过程和推理依据的内生原因,另一方面,也是加深对于加料工艺流程理解的需要。

最后,在训练模型前,对训练过程和数据进行必要的设定。这些设定主要包括:

1、随机选取70%的数据用于训练模型,30%的数据用于验证模型。

2、将隐含层设定为两层,隐含层中的单位数设置在1到50之间的,具体的单位数由算法自动计算。

3、选取隐含层的激活函数为双曲正切函数,输出层的激活函数为恒等函数。

4、将停机条件设置为最大训练次数为250次。

表1 神经网络输入层变量


数据挖掘技术在烟草设备运行管理中应用探索

热风温度控制阀开度设定


数据挖掘技术在烟草设备运行管理中应用探索

图1 加料出口水分实际值与预测值对比图

下一步的工作,将对图1和图2中用红色方框标示的预测对比和残差分析中的孤立点进行分析,找到这些孤立点出现的原因。并进行消除和判断。

数据挖掘技术在烟草设备运行管理中应用探索

图2 加料出口水分实际值与预测值残差分析图

通过图1反映的实际值与预测值的对比,以及图2所示的残差分析,我们可以发现神经网络的预测效果良好,基本可以达到实用的要求,为设备运行参数控制提供了初始的预测仿真模型。为在生产过程中精准控制运行参数,提前预防故障和质量缺陷产生提供了可能,在这个数学模型的基础上,继续开发运行参数反馈控制系统和专家诊断系统,为实现智能化制造奠定了基础。

4、总结与展望

设备运行管理是烟草企业的生产管理中重要内容,设备技术状态直接影响到烟叶生产的质量,同时也对设备操作人员设备控制的实时性和精确性提出了更高的要求。本文对数据挖掘技术在烟草行业设备运行管理中的应用和发展进行了论述,同时结合生产实践,围绕加料机的出口水分问题,运用神经网络技术建立了预测模型。实验结果表明,该模型的预测效果良好,能够用于指导实际的生产实践。

近期,我们将在明确数据需求的基础上,围绕质量导向目标,应用“大数据”“数据可视化”等技术,进行数据统计、分析、决策模型建设。逐步建立异常判定、停机分析、故障异常预测、诊断专家系统、智能健康评价、备件消耗模型等系列分析方法。为烟草工业走向中国制造2025,实现智能制造,提升设备管理精益化水平,做出力所能及的贡献。



分享到:


相關文章: