基于SVM的航空发动机故障诊断系统设计

创始人

2024-02-06 11:43:30

0次

第1关：准备实验数据

任务描述：

相关知识：

一、获取数据：

二、读取数据集：

三、如何找出对应的数据列：

编程要求：

测试说明：

第二关：数据预处理

任务描述：

相关知识：

数据标准化：

主成分分析降维：

编程要求：

第三关：SVM模型训练

任务描述：

相关知识：

一、分割数据集：

二、建立SVM模型：

三、模型测试：

编程要求：

第四关：数据可视化：

任务描述：

相关知识：

一、AUCC曲线含义：

二、绘制AUC曲线：

第1关：准备实验数据

任务描述：

本关任务：补充数据准备模块代码，应用Panads模块，生成训练数据集。读取航空发动机模拟数据，每个发动机的第一条数据为正常状态数据，最后一条数据为故障状态数据，共有4个故障状态，分别为1，2，3，4，正常状态label为0

编程要求：

根据提示，在右侧编辑器补充代码，计算并输出数据集合的尺寸shape。

测试说明：

预期输出： (2832, 26)

import os
import pandas as pd
import pickle
import numpy as np
import os
data_path =r'data/'
#将每个发动机的第一行数据作为正常样本，最后一行作为故障样本
def get_local_data(data):data_extract = data.iloc[:, 0:26]list = data_extract['NO'].unique()data_norm = pd.DataFrame()data_x = pd.DataFrame()for i in list:#**********Begin**********##第一步 进行数据读取 在两个空内分别填入切片索引df_first = data_extract[data_extract.NO == i].iloc[0]#此处填入切片索引df_last = data_extract[data_extract.NO == i].iloc[-1]#此处填入切片索引data_norm = data_norm.append(df_first, ignore_index=True)data_x = data_x.append(df_last, ignore_index=True)#**********End**********#return data_norm,data_x
#读取csv数据文件
def get_data(tag="labeled"):data_norm = pd.DataFrame()for root, _, files in os.walk(data_path):for file in files:if 'txt' not in file:continue#**********Begin**********##第二步 读取csv数据文件 在空内填入文件路径，并设置数据读取间隔data = pd.read_csv(data_path+file, sep=' ') #此处填写read_csv函数，用于读取csv文件，数据间隔为' '#**********End**********#if "001" in file:data_norm_1,data_1 = get_local_data(data)if "002" in file:data_norm_2,data_2 = get_local_data(data)if "003" in file:data_norm_3,data_3 = get_local_data(data)if "004" in file:data_norm_4,data_4 = get_local_data(data)if "111" in file:data_norm_5,data_11 = get_local_data(data)if "222" in file:data_norm_6,data_22 = get_local_data(data)if "333" in file:data_norm_7,data_33 = get_local_data(data)if "444" in file:data_norm_8,data_44 = get_local_data(data)data_norm = data_norm.append([data_norm_1,data_norm_2,data_norm_3,data_norm_4,data_norm_5,data_norm_6,data_norm_7,data_norm_8],ignore_index=True)data_1 = data_1.append(data_11,ignore_index=True)data_2 = data_2.append(data_22, ignore_index=True)data_3 = data_3.append(data_33, ignore_index=True)data_4 = data_4.append(data_44, ignore_index=True)return data_norm, data_1,data_2,data_3,data_4def  get_numpy_data(data):data = data.iloc[:,1:-1]#print(data.describe())#print(data.head())return np.array(data)#错误类
class LABEL(object):NL = 0FE = 1FF = 2HE = 3HF = 4def run():data_norm, data_1,data_2,data_3,data_4= get_data()normal,fault_1,  fault_2, fault_3,fault_4 = [LABEL.NL]*data_norm.shape[0],[LABEL.FE]*data_1.shape[0],\[LABEL.FF]*data_2.shape[0],[LABEL.HE]*data_3.shape[0],[LABEL.HF]*data_4.shape[0]labels = normal+fault_1+fault_2+fault_3+fault_4labels = np.array(labels)labels = np.array(labels > 0).astype(np.int)data_select = data_norm.append([data_1,data_2,data_3,data_4])data_select_array = get_numpy_data(data_select)jsj_data_file = data_path +'jsj_data.pkl'jsj_data = open(jsj_data_file, 'wb')#**********Begin**********##第三步 pickle保存数据   在空内填入保存参数pickle.dump(data_select_array,jsj_data)            #填入参数以保存data_select数据pickle.dump(labels,jsj_data)            #填入参数保存labels数据#**********End**********#jsj_data.close()if __name__ == "__main__":run()

第二关：数据预处理

任务描述：

本关任务：要求对第一关获取的数据进行数据预处理，包括数据标准化与主成分分析降维。

编程要求：

根据提示，在右侧编辑器补充代码，完成实验任务。

from sklearn.preprocessing import StandardScaler
import pickle
from sklearn.decomposition import PCA
import os
data_path =r'data/'
def Stage_2():#**********Begin**********##第一步 读取Stage_1保存的数据文件，在空内填入保存参数f = open(data_path+'jsj_data.pkl','rb')#填空，按照字节读取pkl数据data = pickle.load( f) #填空获取训练数据labels = pickle.load(f )#填空获取标签#**********End**********#f.close()#**********Begin**********##第二步 进行数据归一化处理，在空内填入参数normalizer = StandardScaler().fit(data)  # 数据归一化data_scale = normalizer.transform(data )     #填空，对数据进行归一化，得到data_scalepca = PCA(n_components= 21)                 #填空，确定PCA参数#**********End**********##**********Begin**********##第三步 进行数据PCA，在空内填入参数data_PCA = pca.fit_transform(data_scale)  #填入参数#**********End**********#jsj_data_file = data_path +'data_pca.pkl'jsj_data = open(jsj_data_file, 'wb')pickle.dump(data_PCA,jsj_data)pickle.dump(labels,jsj_data)jsj_data.close()

第三关：SVM模型训练

任务描述：

本关任务：训练SVM并进行测试。

编程要求：

根据提示，在右侧编辑器补充代码，完成实验任务。

import pickle
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
import os
data_path =r'data/data_pca.pkl'def Stage_3_1():f = open('data/data_pca.pkl','rb')#按照字节读取pkl数据data_PCA = pickle.load(f) #获取训练数据labels = pickle.load(f)#获取标签f.close()#**********Begin**********##第一步 分割数据集trainX, testX, trainY, testY = train_test_split(data_PCA, labels, test_size=0.1, random_state=42) #填空，将数据集分为测试样本与训练样本，分割度为10%#**********End**********#return trainX, testX, trainY, testY
def Stage_3_2(trainX,trainY):#**********Begin**********##第二步 进行SVM模型设置并训练clf = SVC(probability=True)                       #填空，构建SVM模型clf.fit(trainX,trainY)                         #填空，进行SVM模型训练，以trainX为训练样本集，trainY为训练样本标签#**********End**********#return clf

第四关：数据可视化：

任务描述：

本关任务：绘制ROC曲线。

相关知识：

为了完成本关任务，你需要掌握：1.AUC曲线的含义，2.绘制AUC曲线。

一、AUCC曲线含义：

AUC： AUC 的全称是 Area under the Curve of ROC，也就是ROC曲线下方的面积。在机器学习领域，经常用 AUC 值来评价一个二分类模型的训练效果。在机器学习理论中，可用ROC曲线来分析二元分类模型。在二分类问题中，数据的标签通常用（0/1）来表示，在模型训练完成后进行测试时，会对测试集的每个样本计算一个介于0~1之间的概率，表征模型认为该样本为阳性的概率。我们可以选定一个阈值，将模型计算出的概率进行二值化，比如选定阈值等于0.5，那么当模型输出的值大于等于0.5时，我们就认为模型将该样本预测为阳性，也就是标签为 1，反之亦然。选定的阈值不同，模型预测的结果也会相应地改变。二元分类模型的单个样本预测有四种结果：真阳性（TP）：判断为阳性，实际也是阳性。

伪阳性（FP）：判断为阳性，实际却是阴性。

真阴性（TN）：判断为阴性，实际也是阴性。

伪阴性（FN）：判断为阴性，实际却是阳性。

ROC曲线将假阳性率（FPR）定义为X轴，真阳性率（TPR）定义为Y轴。

其中：TPR ：在所有实际为阳性的样本中，被正确地判断为阳性的样本比率。

TPR=TP/(TP+FN)

FPR：在所有实际为阴性的样本中，被错误地判断为阳性的样本比率。

FPR=FP/(FP+TN)

给定一个二分类模型和它的阈值，就可以根据所有测试集样本点的真实值和预测值计算出一个(X=FPR,Y=TPR)坐标点，使用单点绘图方法即可得到ROC曲线。

AUC被定义为ROC曲线下的面积，显然这个面积的数值不会大于1。在检验模型时，AUC值越大的模型，正确率越高。

二、绘制AUC曲线：

对于AUC曲线，sklearn提供roc_curve函数 matplotlib模块提供绘图工具

示例如下：

false_positive_rate, true_positive_rate, thresholds = roc_curve(testY,predict_prob[:,1])
roc_auc=auc(false_positive_rate, true_positive_rate)
plt.figure()
plt.plot(false_positive_rate, true_positive_rate,'b',label='AUC = %0.2f'% roc_auc)
plt.legend(loc='lower right')
plt.plot([0,1],[0,1],'r--')
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('receiver operating cha\fracteristic')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.0])
plt.legend(loc="lower right")
plt.show()

import matplotlib
import matplotlib.pyplot as plt
matplotlib.use("Agg")def draw_ROC(false_positive_rate,true_positive_rate,roc_auc):#**********Begin**********##绘制ROC曲线 设置plt参数plt.plot(false_positive_rate, true_positive_rate,'b',label='AUC = %0.2f'% roc_auc)#填空，绘制AUC曲线plt.legend(loc='lower right')plt.plot([0,1],[0,1],'r--')plt.xlabel('False Positive Rate')#填空，设置xlabel为'False Positive Rate'plt.ylabel('True Positive Rate')#填空，设置ylabel为'True Positive Rate'plt.title('receiver operating characteristic')#填空，设置title为'receiver operating characteristic'#**********End**********#plt.xlim([0.0, 1.0])plt.ylim([0.0, 1.0])plt.legend(loc="lower right")#plt.show()plt.savefig('Stage4/plt_image_cor/correct_fig.png')

上一篇：买显卡上车是什么意思

下一篇：看图猜成语一堆草和一个人

基于SVM的航空发动机故障诊断系统设计

第1关：准备实验数据

任务描述：

相关知识：

一、获取数据：

二、读取数据集：

三、如何找出对应的数据列：

编程要求：

测试说明：

第二关：数据预处理

任务描述：

相关知识：

数据标准化：

主成分分析降维：

编程要求：

第三关：SVM模型训练

任务描述：

相关知识：

一、分割数据集：

二、建立SVM模型：

三、模型测试：

编程要求：

第四关：数据可视化：

任务描述：

相关知识：

一、AUCC曲线含义：

二、绘制AUC曲线：

相关内容

热门资讯