回复
聊聊基于 LSTM 的多特征序列预测-SHAP可视化!
前言
本文基于前期介绍的电力变压器,介绍一种基于 LSTM 预测模型的 SHAP 可视化分析教程。
数据集是使用.csv形式进行存储的,包括了除时间列外 “HUFL”, “HULL”, “MUFL”, “MULL”, “LUFL”, “LULL” 和 “OT”7个特征。
1 多特征变量数据集制作与预处理
1.1 导入数据集
取油温数据 OT 为目标预测值!
1.2 数据集制作
按照 8:2 划分训练集,测试集,滑动窗口设置为12
2 基于Pytorch的 LSTM 预测模型
2.1 定义 LSTM 预测模型
2.2 设置参数,训练模型
注意调整参数:
- 可以修改LSTM层数和每层神经元个数;
- 增加更多的 epoch (注意防止过拟合)
- 可以改变滑动窗口长度(设置合适的窗口长度)
3 模型评估与可视化
3.1 结果可视化
3.2 模型评估
4 SHAP 可视化分析
SHAP 特征重要性-Summary Plot
将 SHAP 值矩阵传递给条形图函数会创建一个全局特征重要性图,其中每个特征的全局重要性被视为该特征在所有给定样本中的平均绝对值。
上面使用Summary Plot方法并设置参数plot_type="bar"绘制典型的特征重要性条形图,而他默认绘制Summary_plot图,他是结合了特征重要性和特征效果,取代了条形图。
Summary_plot 为每一个样本绘制其每个特征的Shapley value,它说明哪些特征最重要,以及它们对数据集的影响范围。
y 轴上的位置由特征确定,x 轴上的位置由每 Shapley value 确定。颜色表示特征值(红色高,蓝色低),颜色使我们能够匹配特征值的变化如何影响风险的变化。重叠点在 y 轴方向抖动,因此我们可以了解每个特征的 Shapley value分布,并且这些特征是根据它们的重要性排序的。
赞
收藏
回复
相关推荐