鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

时频图像分类，还在用VGG、ResNet?

发布于 2024-8-30 13:21

浏览

0收藏

SwinTransformer是一种通用视觉任务的Backbone而存在的模型，以替代CNN：

时频图像分类，还在用VGG、ResNet?-AI.x社区

（1）层次化设计：

Swin Transformer引入了层次化特征表示的概念，类似于CNNs中常见的金字塔结构。这使得它在处理高分辨率图像时更加高效，能够逐步聚合信息，并以多尺度特征应对不同的视觉任务。

（2）滑动窗口机制：

Swin Transformer通过滑动窗口的方式计算注意力，使得每个窗口内部的注意力计算复杂度大幅降低。这种局部注意力机制有效地解决了ViT在高分辨率图像处理时的计算瓶颈问题。

（3）移位窗口策略：

为了增强不同窗口间的信息交流，Swin Transformer采用了移位窗口策略（Shifted Window）。这种策略通过在相邻层中移动窗口的位置，实现了跨窗口的信息交互，从而提升了模型的表达能力。

前言

在基于格拉姆矩阵GAF、连续小波变换CWT、短时傅里叶变换STFT+Swin Transformer窗口注意力和CNN-GAM全局注意力的轴承故障诊断模型基础上!

再新添基于马尔可夫转换场 MTF 和递归图 RP 的时频图像处理（提供更改数据集接口，可一键替换信号数据和不同图像的变换处理，来进行与Swin-CNN-GAM模型的结合）

代码下载地址：

https://mbd.pub/o/bread/ZZ2VmJtt

轴承一维故障信号数据（十分类）：

时频图像分类，还在用VGG、ResNet?-AI.x社区

马尔可夫转换场 MTF：

时频图像分类，还在用VGG、ResNet?-AI.x社区

递归图 RP ：

时频图像分类，还在用VGG、ResNet?-AI.x社区

格拉姆矩阵GAF变换二维图像数据

时频图像分类，还在用VGG、ResNet?-AI.x社区

电能质量扰动信号：

时频图像分类，还在用VGG、ResNet?-AI.x社区

马尔可夫转换场 MTF：

时频图像分类，还在用VGG、ResNet?-AI.x社区

递归图 RP：

时频图像分类，还在用VGG、ResNet?-AI.x社区

GAF变换二维图像数据

时频图像分类，还在用VGG、ResNet?-AI.x社区

● 数据集：经测试，模型在CWRU西储大学轴承数据集和哈工大航天发动机轴承数据集上表现分类准确率均为100%！

● 环境框架：python 3.9 pytorch 1.8 及其以上版本均可运行

● 准确率：测试集100%

● 使用对象：论文需求、毕业设计需求者

● 代码保证：代码注释详细、即拿即可跑通。

模型创新点还未发表，有毕业设计或者发小论文需求的同学必看，模块丰富，创新度高，性能优越！

代码配有

（1）训练可视化：

时频图像分类，还在用VGG、ResNet?-AI.x社区

（2）原始数据 t-SNE特征可视化：

时频图像分类，还在用VGG、ResNet?-AI.x社区

（3）模型训练后的 t-SNE特征可视化：

时频图像分类，还在用VGG、ResNet?-AI.x社区

（4）混淆矩阵：

时频图像分类，还在用VGG、ResNet?-AI.x社区

（5）分类标签可视化

时频图像分类，还在用VGG、ResNet?-AI.x社区

创新点：

（1）通过格拉姆矩阵GADF把一维时序故障信号转化为二维图像；

（2）分支一：图像数据通过顶会模型 Swin Transformer 的窗口注意力机制提取故障图像局部特征；

（3）分支二：同时故障图数据像通过基于全局注意力机制 GAM-Attention 的 CNN2d 卷积池化网络；

（4）然后两个分支提取的全局空间特征和局部特征通过融合后进行自适应平均池化，使模型能够更好地融合不同层次的特征表示，提高模型性能和泛化能力。

本文转载自建模先锋，作者：小蜗爱建模

标签

赞

收藏

回复

举报

回复

相关推荐

【LLM】大语言模型在用户兴趣探索中的应用

sbf_2000 • 2664浏览 • 0回复
(分类/训练/评估)

angel • 4796浏览 • 0回复
基于Mamba架构的，状态空间音频分类模型AUM

Aceryt • 1390浏览 • 0回复
时频图像分类，还在用VGG、ResNet?

Tang_Lan • 1624浏览 • 0回复
机器学习利器——决策树分类器深度解析

51CTO内容精选 • 1163浏览 • 0回复
基于PyTorch自动混合精度库对ResNet50模型进行优化训练

51CTO内容精选 • 1199浏览 • 0回复
五种时频图像一键切换，CVPR 顶会+多模态融合

Tang_Lan • 1102浏览 • 0回复
你是否还在认为大模型没什么实际作用？事实上大模型应用已经遍地开花

AI探索时代 • 989浏览 • 0回复
训练大模型时，显存都哪去了？

鱼虫子 • 1745浏览 • 0回复
AdaBoost分类器完全图解

51CTO内容精选 • 1013浏览 • 0回复
测试时训练(TTT)太强了！

NLP前沿1 • 1146浏览 • 0回复
五种时频图像一键切换，CVPR 顶会+多模态融合

Tang_Lan • 1411浏览 • 0回复
基于CNN＋PyTorch实现视觉检测分类

51CTO内容精选 • 927浏览 • 0回复
ChatGPT高手都在用的4个对话公式，让人工智能更懂你

草台AI • 1174浏览 • 0回复
基于时频特征融合的高创新时间序列分类模型

Tang_Lan • 977浏览 • 0回复
我们一起聊聊分类模型：层次聚类

宝宝数模AI • 645浏览 • 0回复
闭着眼学机器学习—朴素贝叶斯分类

AIPaperDaily • 526浏览 • 0回复
DeepSeek 爆了，普通人如何3小时完全从0训练自己的大模型

玄姐聊AGI • 3852浏览 • 0回复
还在苦苦求 Manus 激活码？OpenManus 它来了，五人花了三小时复刻并开源！

wsp_ping • 107浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

热门推荐

4090单卡部署满血 671B DeepSeek，本地部署“成本骤降32倍”！！！ 0回复

从推理到编程，详细比较DeepSeek 32B、70B、R1实践性能 0回复

综述：DeepSeek Infra/V1/MoE/V2/V3/R1 & 开源关键技术 0回复

低成本+高性能+超灵活！Deepseek 671B + Milvus 重新定义知识库搭建！ 0回复

DeepSeek R1 全系列模型部署指南 0回复

上一篇：时频图像分类，还在用VGG、ResNet?

下一篇：即插即用 | 时间编码+LSTM+全局注意力

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载