CN:36-1239/TH

ISSN:1672-3872

半月刊

JST日本科学技术振新机构数据库(日)(2024)

中文核心期刊(遴选)数据库收录期刊

中文科技期刊数据库收录期刊

中国学术期刊(光盘版)全文收录期刊

中国期刊网收录期刊

中国学术期刊综合评价数据库 统计源期刊

搜索
搜索
这是描述信息

基于MobileViT轻量化网络的遥感图像分类方法研究

访问量:

DOI:10.3969/j.issn.1672-3872.2023.16.023

作者:程忠,黄明辉(长安大学工程机械学院,陕西 西安 710000)

 

摘 要:【目的】针对遥感图像分类任务,为使模型精确捕获高层语义信息的同时降低计算复杂度,解决遥感图像分类任务中类内差异大而类间差异小的问题,提出了基于MobileViT轻量化网络的遥感图像分类方法。【方法】基于Transformer框架,通过在卷积神经网络中引入注意力机制来实现对图像特征的提取和编码。在训练阶段,MobileViT使用类似于传统Transformer模型的自监督学习方法,即通过无监督的方式学习图像特征的表示。通过使用一种名为Contrastive Multiview Coding(CMC)的学习策略,该策略可以通过最大化不同视角下的图像相似性来学习图像特征。在训练过程中,MobileViT使用随机数据增强技术和Dropout等方法来增加模型的泛化能力,同时应用权重衰减和梯度剪裁等技术来避免过拟合和爆炸梯度问题。在推理阶段,MobileViT将输入的图像沿着通道轴划分成多个块,并将每个块作为一个序列输入到Transformer网络中。在Transformer网络中,MobileViT采用多头自注意力机制和全连接层,将每个块的特征编码成一个固定长度的向量。然后,MobileViT使用全局池化操作来获得整个图像的表示,并将其送入一个分类器中进行预测。在MobileViT中,局部注意力机制和跨尺度注意力机制被嵌入到了Transformer网络结构中,从而提升了模型的性能。【结果】本方法可以避免过拟合问题,实现对图像特征的高效提取和编码,在AID测试集的准确率达95.0%,在RSD46-WHU测试集的准确率达87.4%,具有较好的鲁棒性,能够在短时间的训练中快速提升准确率,在不损失大量精度的情况下,极大地减少了Transformer框架训练所需的参数,可为Transformer轻量化设计奠定基础。

关键词:图像分类;卷积神经网络;Transformer;空间位置信息;注意力机制

 

引文信息 [1]程忠,黄明辉.基于MobileViT轻量化网络的遥感图像分类方法研究[J].南方农机,2023,54(16):81-83.

查看全文请下载PDF文件↓

相关下载

分类:
2023年
文件大小:
1.4M
2023-08-11 17:15:11
所属人群:
所有人
上一页
1
底部logo

公众号

地       址:江西省南昌市红谷滩红谷中大道1326号江报传媒大厦908室

联系电话:0791-86202556

投稿邮箱:nfnj@vip.163.com

版权所有:江西南方农机杂志社有限责任公司.  All rights reserved.   SEO     赣ICP备2023003226号-1       技术支持:中企动力-南昌