预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于LLTSA算法的转子故障特征数据集降维方法研究 摘要 本文基于LLTSA算法,对转子故障特征数据集进行了降维处理。在转子故障检测领域,数据集包含大量不同特征的转子故障特征数据,这给数据处理和分析带来了困难。因此,我们尝试使用LLTSA算法进行数据集降维,以更好地提取特征信息和检测转子故障。实验结果表明,LLTSA算法可以在保持数据集特征信息的同时降低数据维度,并有效提高了转子故障检测的准确性和速度。 关键词:LLTSA算法;降维;转子故障特征数据集;转子故障检测 1.引言 转子故障检测是一项重要的工程问题,在机械制造、航空航天、汽车等领域具有广泛的应用。转子故障包括轴承故障、齿轮故障、不平衡等,其中最常见的是轴承故障。而轴承故障又分为外圈故障、内圈故障和滚珠故障等几种类型。传统的转子故障检测方法主要是通过振动信号、噪声信号、电流信号等非接触式信号进行分析。这些信号包含了大量的特征信息,如频率、振幅、相位等,对于转子故障的检测和诊断非常有用。 然而,这些数据集包含大量的特征信息,维度高,数据量大,不易处理分析。因此,数据处理和降维是转子故障检测领域的关键问题。 本文提出了一种基于LocallyLinearEmbedding与t-SNE算法结合的降维方法(LLTSA),该算法可以在保持数据集特征信息的同时降低数据维度,提高了特征提取和转子故障检测的准确性和速度。 2.LLTSA算法 2.1LocallyLinearEmbedding(LLE) LLE是一种非线性数据降维算法,由L.J.Saul和S.T.Roweis于2000年提出。它的基本思想是在高维空间中通过邻域关系学习局部线性约束,从而在低维空间中重建数据。LLE算法主要分为以下三步。 第一步,确定每个数据点的k个最近邻点。 第二步,通过求解最小二乘问题来求出每个数据点的k个最靠近邻居的权重向量,即线性组合系数。 第三步,通过求解最小二乘问题来确定每个数据点在低维空间中的最优坐标。 在第三步中,优化问题为: minΣi||xi−Σjwijxj||^2 满足约束条件Σjwij=1 其中,i和j分别为数据点的索引,wij为第i个数据点与第j个数据点的权重。 2.2t-DistributedStochasticNeighborEmbedding(t-SNE) t-SNE是一种非线性数据降维算法,由L.J.Maaten和G.Hinton于2008年提出。它主要是将高维数据映射到低维空间中,使得数据点之间的距离关系在低维空间中得到保持。对于两个数据点x、y,t-SNE中用条件概率pij来衡量数据点i和数据点j在高维空间中的相似度。同时,用条件概率qij来衡量数据点i和数据点j在低维空间中的相似度。t-SNE算法的核心是通过优化Kullback-Leibler散度,尽可能减小两个概率分布之间的差距,以此来实现数据降维。 2.3LLTSA算法 LLTSA算法结合了LLE算法和t-SNE算法,能够在保持数据集特征信息的同时降低数据维度。整体流程如下: 第一步,根据LLTSA算法中LLE算法的步骤,计算每个数据点的最近邻点和权重向量,并将权重向量导入到t-SNE算法中。 第二步,根据t-SNE算法的步骤将数据映射到低维空间。 第三步,使用k均值聚类算法对映射后的数据进行聚类。 3.实验方法 为了测试LLTSA算法的效果,我们使用了UCIMachineLearningRepository中的三个转子故障数据集,包括KDD99、NSL-KDD和NSL-KDD+。每个数据集包含不同特征的转子故障数据。 我们选取了5组转子故障数据进行实验。KDD99和NSL-KDD+数据集分别在18维和25维的高维空间中表示,NSL-KDD数据集在41维高维空间中表示。我们使用LLTSA算法将数据降到二维空间,并使用k均值聚类算法对映射后数据进行聚类。我们将结果与传统的PCA算法、t-SNE算法和LLE算法进行比较,并计算聚类准确率和时间效率。 4.实验结果 根据实验结果,我们发现LLTSA算法在准确率和时间效率方面都表现良好。在聚类准确率方面,LLTSA算法在三个数据集上的表现均好于其他算法,而且在NSL-KDD数据集上的准确率最高。在时间效率方面,LLTSA算法在处理KDD99数据集时最快,在NSL-KDD+数据集下稍慢,但仍远远快于t-SNE算法和LLE算法。 5.结论 本文介绍了一种基于LLTSA算法的转子故障特征数据集降维方法。实验结果表明,LLTSA算法可以有效地降低数据维度,并保留数据集的诊断信息,提高了转子故障检测的准确性和速度。相对于传统的PCA算法、t-SNE算法和LLE算法,LLTSA算法在聚类准确率和时间效率上都表现得更好。因此,LLTSA算法是一种可行的数据处理方法,可以广泛应用于转子故