时频图像分类，还在用VGG、ResNet?

Tang_Lan

发布于 2024-8-28 15:28

浏览

0收藏

SwinTransformer是一种通用视觉任务的Backbone而存在的模型，以替代CNN：

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

（1）层次化设计：

Swin Transformer引入了层次化特征表示的概念，类似于CNNs中常见的金字塔结构。这使得它在处理高分辨率图像时更加高效，能够逐步聚合信息，并以多尺度特征应对不同的视觉任务。

（2）滑动窗口机制：

Swin Transformer通过滑动窗口的方式计算注意力，使得每个窗口内部的注意力计算复杂度大幅降低。这种局部注意力机制有效地解决了ViT在高分辨率图像处理时的计算瓶颈问题。

（3）移位窗口策略：

为了增强不同窗口间的信息交流，Swin Transformer采用了移位窗口策略（Shifted Window）。这种策略通过在相邻层中移动窗口的位置，实现了跨窗口的信息交互，从而提升了模型的表达能力。

前言

在基于格拉姆矩阵GAF、连续小波变换CWT、短时傅里叶变换STFT+Swin Transformer窗口注意力和CNN-GAM全局注意力的轴承故障诊断模型基础上!

再新添基于马尔可夫转换场 MTF 和递归图 RP 的时频图像处理（提供更改数据集接口，可一键替换信号数据和不同图像的变换处理，来进行与Swin-CNN-GAM模型的结合）

代码下载地址：

https://mbd.pub/o/bread/ZZ2VmJtt

轴承一维故障信号数据（十分类）：

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

马尔可夫转换场 MTF：

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

递归图 RP ：

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

格拉姆矩阵GAF变换二维图像数据

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

电能质量扰动信号：

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

马尔可夫转换场 MTF：

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

递归图 RP：

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

GAF变换二维图像数据

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

● 数据集：经测试，模型在CWRU西储大学轴承数据集和哈工大航天发动机轴承数据集上表现分类准确率均为100%！

● 环境框架：python 3.9 pytorch 1.8 及其以上版本均可运行

● 准确率：测试集100%

● 使用对象：论文需求、毕业设计需求者

● 代码保证：代码注释详细、即拿即可跑通。

模型创新点还未发表，有毕业设计或者发小论文需求的同学必看，模块丰富，创新度高，性能优越！

代码配有

（1）训练可视化：

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

（2）原始数据 t-SNE特征可视化：

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

（3）模型训练后的 t-SNE特征可视化：

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

（4）混淆矩阵：

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

（5）分类标签可视化

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

创新点：

（1）通过格拉姆矩阵GADF把一维时序故障信号转化为二维图像；

（2）分支一：图像数据通过顶会模型 Swin Transformer 的窗口注意力机制提取故障图像局部特征；

（3）分支二：同时故障图数据像通过基于全局注意力机制 GAM-Attention 的 CNN2d 卷积池化网络；

（4）然后两个分支提取的全局空间特征和局部特征通过融合后进行自适应平均池化，使模型能够更好地融合不同层次的特征表示，提高模型性能和泛化能力。

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

注意：此次产品，我们还有配套的模型讲解（方便学习网络结构）和参数调节讲解，进行详细的解释！

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

我们还提供关于一维时序信号的马尔可夫转换场 MTF 和递归图 RP 、格拉姆矩阵GAF、连续小波变换CWT、短时傅里叶变换STFT等相关时频图像的分类处理方法，提供更改数据集接口，可一键替换信号数据和不同图像的变换处理，来进行此创新模型的实验验证！

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

连续小波变换CWT时频图数据

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

短时傅里叶变换STFT时频图数据

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

基于GADF+Swin-CNN-GAM分类网络模型

设置参数，训练模型

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

50个epoch，准确率近100%，用GADF+Swin-CNN-GAM网络分类效果显著，创新模型能够充分提取轴承故障信号的全局空间和局部特征，收敛速度快，性能优越，精度高，效果明显!

模型评估

准确率、精确率、召回率、F1 Score

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

故障十分类混淆矩阵：

时频图像分类，还在用VGG、ResNet?-AI.x社区图片

本文转载自建模先锋，作者：小蜗爱建模

标签

VGG

ResNet

模型

相关推荐

【LLM】大语言模型在用户兴趣探索中的应用

sbf_2000 • 3599浏览 • 0回复
(分类/训练/评估)

angel • 5816浏览 • 0回复
基于Mamba架构的，状态空间音频分类模型AUM

Aceryt • 2212浏览 • 0回复
时频图像分类，还在用VGG、ResNet?

Tang_Lan • 2111浏览 • 0回复
基于PyTorch自动混合精度库对ResNet50模型进行优化训练

51CTO内容精选 • 2091浏览 • 0回复
五种时频图像一键切换，CVPR 顶会+多模态融合

Tang_Lan • 1939浏览 • 0回复
你是否还在认为大模型没什么实际作用？事实上大模型应用已经遍地开花

AI探索时代 • 1736浏览 • 0回复
训练大模型时，显存都哪去了？

鱼虫子 • 2552浏览 • 0回复
AdaBoost分类器完全图解

51CTO内容精选 • 1914浏览 • 0回复
测试时训练(TTT)太强了！

NLP前沿1 • 2076浏览 • 0回复
五种时频图像一键切换，CVPR 顶会+多模态融合

Tang_Lan • 2460浏览 • 0回复
基于CNN＋PyTorch实现视觉检测分类

51CTO内容精选 • 1749浏览 • 0回复
ChatGPT高手都在用的4个对话公式，让人工智能更懂你

草台AI • 2054浏览 • 0回复
基于时频特征融合的高创新时间序列分类模型

Tang_Lan • 1891浏览 • 0回复
DeepSeek 爆了，普通人如何3小时完全从0训练自己的大模型

玄姐聊AGI • 5580浏览 • 0回复
还在苦苦求 Manus 激活码？OpenManus 它来了，五人花了三小时复刻并开源！

wsp_ping • 1147浏览 • 0回复
基于1D-GRU+2D-MTF-ResNet-CBAM的分类模型

Tang_Lan • 1299浏览 • 0回复
关于大模型的分类和应用

AI探索时代 • 1236浏览 • 0回复
三大AI超能力：分类式AI、预测式AI和生成式AI

51CTO内容精选 • 630浏览 • 0回复

angel

LV.9

这个用户很懒，还没有个人简介

觉得TA不错？点个关注精彩不错过

325

帖子

3027

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

时频图像分类，还在用VGG、ResNet?

前言

轴承一维故障信号数据（十分类）：

代码配有

连续小波变换CWT时频图数据

短时傅里叶变换STFT时频图数据

基于GADF+Swin-CNN-GAM分类网络模型

设置参数，训练模型

模型评估

目录