时频图像分类,还在用VGG、ResNet?
SwinTransformer是一种通用视觉任务的Backbone而存在的模型,以替代CNN:
(1)层次化设计:
Swin Transformer引入了层次化特征表示的概念,类似于CNNs中常见的金字塔结构。这使得它在处理高分辨率图像时更加高效,能够逐步聚合信息,并以多尺度特征应对不同的视觉任务。
(2)滑动窗口机制:
Swin Transformer通过滑动窗口的方式计算注意力,使得每个窗口内部的注意力计算复杂度大幅降低。这种局部注意力机制有效地解决了ViT在高分辨率图像处理时的计算瓶颈问题。
(3)移位窗口策略:
为了增强不同窗口间的信息交流,Swin Transformer采用了移位窗口策略(Shifted Window)。这种策略通过在相邻层中移动窗口的位置,实现了跨窗口的信息交互,从而提升了模型的表达能力。
前言
在基于格拉姆矩阵GAF、连续小波变换CWT、短时傅里叶变换STFT+Swin Transformer窗口注意力和CNN-GAM全局注意力的轴承故障诊断模型基础上!
再新添基于马尔可夫转换场 MTF 和递归图 RP 的时频图像处理(提供更改数据集接口,可一键替换信号数据和不同图像的变换处理,来进行与Swin-CNN-GAM模型的结合)
代码下载地址:
https://mbd.pub/o/bread/ZZ2VmJtt
轴承一维故障信号数据(十分类):
马尔可夫转换场 MTF:
递归图 RP :
格拉姆矩阵GAF变换二维图像数据
电能质量扰动信号:
马尔可夫转换场 MTF:
递归图 RP:
GAF变换二维图像数据
● 数据集:经测试,模型在CWRU西储大学轴承数据集 和 哈工大航天发动机轴承数据集上表现分类准确率 均为100%!
● 环境框架:python 3.9 pytorch 1.8 及其以上版本均可运行
● 准确率:测试集100%
● 使用对象:论文需求、毕业设计需求者
● 代码保证:代码注释详细、即拿即可跑通。
模型创新点还未发表,有毕业设计或者发小论文需求的同学必看,模块丰富,创新度高,性能优越!
代码配有
(1)训练可视化:
(2)原始数据 t-SNE特征可视化:
(3)模型训练后的 t-SNE特征可视化:
(4)混淆矩阵:
(5)分类标签可视化
创新点:
(1)通过格拉姆矩阵GADF把一维时序故障信号转化为二维图像;
(2)分支一:图像数据通过顶会模型 Swin Transformer 的窗口注意力机制提取故障图像局部特征;
(3)分支二:同时故障图数据像通过基于全局注意力机制 GAM-Attention 的 CNN2d 卷积池化网络;
(4)然后两个分支提取的全局空间特征和局部特征通过融合后进行自适应平均池化,使模型能够更好地融合不同层次的特征表示,提高模型性能和泛化能力。
本文转载自 建模先锋,作者: 小蜗爱建模