基于数据融合的多品种小批量产品质量预测方法

时间：

　　摘要：随着智能制造新时代的到来，多品种小批量生产方式逐渐成为主流，对其产品进行质量保证显得尤为重要。针对该生产方式下同种产品加工数量少且产品质量影响因素繁多的特点，文章构建了基于数据融合的质量预测模型。首先，运用分块线性回归分析使用同一设备生产的产品加工数据中隐含的共性特征或规律，充分挖掘样本数据蕴含的产品质量信息。然后，利用卡尔曼滤波进行产品质量预测。最后，仿真实验结果表明，相较于支持向量机预测模型，所提基于数据融合的产品质量预测模型的预测精度更高且解释性更强，为多品种小批量产品质量预测提供了新的思路。

　　关键词：多品种小批量;数据融合;质量预测;分块线性回归

　　0引言

　　当今时代消费者需求日益多样化与个性化，使得生产方式由大规模生产转向多品种小批量生产。该生产方式下的产品价值高，生产工艺复杂，对技术要求严格，一旦出现质量问题将给企业带来巨大损失。与此同时，消费者日趋提高的生活水平也对产品质量提出了更高的要求，产品质量成为制造型企业赢得市场竞争力的关键。因此，对多品种小批量产品进行有效的质量保证成为重要的研究课题。

　　多品种小批量产品生产重复性低导致可供利用的产品历史加工数据较少，这增加了保证产品质量的难度[1]。为对该类产品进行有效的质量保证，学者们从扩充小批量产品样本量以使用传统统计过程控制方法和改进小批量产品质量控制技术两方面进行了探索。这些方法虽能有效进行多品种小批量产品质量保证，但在实际应用时仍有一定的局限性。实际生产过程中，由于具有相似特征的可用产品数据过少且相似程度的计算过程较为复杂，衡量产品定性影响因素的相似性标准不统一，使得其应用难度较大。随着生产技术的不断进步和质量要求的不断提高，质量预测成为产品质量保证研究的重点[2—4]。随着信息技术的不断进步，数字孪生技术[5]为多品种小批量产品的质量保证提供了一种新的思路。针对目前多品种小批量产品质量保证方式存在的不足，选择能够满足产品加工质量要求的设备成为保证产品质量的一个有效的途径[6]。本文对智能加工设备构建了基于数据融合的产品质量预测模型，通过回归发掘同一设备加工的产品质量与其复杂影响因素的规律，利用卡尔曼滤波数据融合进行预测;并与基于支持向量机的产品质量预测模型进行比较，验证了所提模型的效果。

　　1模型构建

　　1.1理论基础

　　1.1.1分块线性回归

　　回归是研究变量之间相关关系的传统方法，线性模型是现代统计学中应用最为广泛的模型之一[7]，而当自变量属性不一致时可采用分块的思路解决问题[8]。分块回归以定量的方式描述各个影响因素与输出质量特性之间的关系，可以处理不同量纲的影响因素对输出质量特性的影响[9]，同时，分块回归可以解决数据收集时，由于不同产品差异化的质量影响因素使得数据出现缺失的问题，尽可能保留所有产品的有效信息。此外，分块思想还可以在一定程度上解决产品质量影响因素繁多造成的数据结构复杂问题[10]。

　　1.2基于数据融合的产品质量预测模型构建

　　本文利用从同一设备的产品加工数据中发现的潜在共性特征规律，预测该加工设备生产某个产品或零件的加工质量。以此为基础，构建了基于数据融合的产品质量预测模型，包括分块线性回归以及卡尔曼滤波融合两个部分，结构如图3所示。首先利用分块回归发现产品质量影响因素及其输出质量特性之间的分布规律建立模型，再通过卡尔曼滤波融合多个分布后进行质量预测，根据输出预测值为产品选择最合适的加工设备，以此保证产品质量。

　　相关期刊推荐：《统计与决策》杂志创办于1985年，设有：理论新探、决策参考、知识丛林、工作视点、财经论坛、经济纵横、统计观察、企业管理、省情咨文、调研世界、工作视点、企业天地、众说纷纭、知识丛林、经验交流等栏目

　　该模型为解决多品种小批量产品质量保证数据量不足的问题提供了一种新思路。相较于利用产品相似性扩充小样本的方式，本文所提方法能够在收集产品被忽视的特殊质量特性、避免相似性复杂的计算过程的同时，对每一影响因素如何影响产品输出质量特性进行具体分析，解决了基于机器学习算法的产品质量预测模型可解释性不足的问题。下面通过仿真实验验证模型效果。

　　2实验与结果

　　2.1数据集获取与处理

　　本文选取UCI数据库中的ConcreteSlump数据和UJIIndoorLoc数据作为实验数据集。其中，ConcreteSlump数据的输入变量为混凝土中水泥、矿渣、粉煤灰、砂率、水、粗骨料、细骨料的含量(kg/m2)，输出变量为坍落度(cm)、流量(cm)、28天抗压强度(Mpa)。UJIIndoorLoc数据的输入变量为520个不同无线接入点处接收到的信号强度(dBM)，输出变量为建筑的纬度、经度、楼层。所用数据集的具体参数见表1。

　　在实际数据收集过程中，由于品种不同，部分产品影响因素数据可能出现缺失，本文在分块回归前剔除该处缺失数据后再进行回归拟合。仿真实验无需进行数据归一化处理。为保证实验结果可靠，本文使用基于数据融合的质量预测模型共进行50次实验，每次实验的训练集和测试集均为随机选取。

　　2.2实验

　　2.2.1实验流程介绍

　　本文以ConcreteSlump数据集为例，介绍基于数据融合的产品质量预测模型具体实验过程。实验通过Matlab2016a操作软件完成，共包括两个部分：模型构建和模型预测。ConcreteSlump数据集部分数据如表2所示。

　　2.3结果与分析

　　本文使用基于数据融合的预测模型分别对ConcreteSlump和UJIIndoorLoc数据集进行预测，并进一步给出了95%的置信区间(篇幅所限，数据从略)。

　　对小批量产品质量预测相关文献研究后发现，SVM在处理小样本问题上具有先天优势，因此，本文使用基于SVM的产品质量预测模型对所选取的数据集进行预测，并与所提模型比较效果。实验采用Matlab2016a操作软件，借助Libsvm支持向量机工具箱编写支持向量机程序。首先，随机选取70%的数据作为训练集，30组数据作为验证集，将数据归一化到[-1,1];然后，选取高斯径向基函数作为支持向量机的核函数，参数g=0.01，惩罚因子系数c=2进行实验并输出30组预测值。

　　通过表3发现，基于数据融合的质量预测模型在两组数据中均取得了良好的预测效果，且其预测精度优于SVM预测模型。ConcreteSlump数据集中，基于数据融合的质量预测模型RMSE为4.28%，较SVM预测模型低了8.63%。UJIIndoorLoc数据中，基于数据融合的模型RMSE为1.527%，较SVM预测模型低0.329%。从运行速度的角度比较时发现，基于SVM的预测模型学习时间更短，预测更加迅速。因此，当处理学习样本较少且对精度要求不太严格时，可以采用基于SVM的产品质量预测模型;当开发一种新产品，需要具体分析每一影响因素对输出质量特性的影响时，本文所提出的方法精度更高。

　　如图4、图5所示，比较两种预测模型的相对误差折线图后发现，当数据维度较低时，SVM预测模型的相对误差明显高于基于数据融合的质量预测模型;当数据维度较高时，基于数据融合的产品质量预测模型效果和基于SVM的质量预测模型效果相当。因为SVM可以将低维数据映射到高维，使得低维下非线性可分的数据映射到高维后就变得线性可分，可避免引入太多维度，出现维数灾难。而所提质量预测模型通过卡尔曼融合步骤将方差过大的正态分布融合实现了降维。

　　3结束语

　　随着生产和生活水平的提升，企业以及消费者对产品质量提出了更高的要求，多品种小批量产品的质量保证方式成为研究重点。针对小批量产品样本量不足，难以使用传统质量预测方法的问题，本文提出了通过选择合适的加工设备进行产品质量保证的新思路，构建了基于数据融合的产品质量预测模型。实验结果表明，该模型预测精度优于SVM预测模型，且当处理高维数据时精度更高。进一步给出了预测值置信区间，帮助企业做出更加合理的生产决策。利用数据融合的质量预测模型可以发现同一设备加工的产品质量特征与其影响因素的潜在规律，为小批量产品制造选择最合适的加工设备，有效保证新产品的设计质量和装配质量，降低质量损失风险，进而降低生产成本。——论文作者：杨剑锋，李永梅，李秀，王宁