8月2日至4日,實驗室王嘉毅和王梓懿同學參加了在云南昆明舉辦的2023中國多媒體大會(ChinaMM2023),并展示了論文《基于小波變換和平行注意力機制的多源遙感圖像分類方法》 、《基于旋轉目標感知網絡的SAR船舶檢測方法》和《基于Transformer和通道混合并行卷積的高光譜圖像去噪方法》。
基于小波變換和平行注意力機制的多源遙感圖像分類方法由王嘉毅和張天戈合作完成,該方法構建了基于小波變換的特征提取器,能夠充分利用頻域分析技術,在可逆下采樣的過程中充分捕捉粗/細粒度級別特征;同時,提出了基于平行注意力機制的特征融合器,充分綜合多模態遙感數據的一致性和差異性,完成強相關性特征的融合和生成,可以顯著提升多源遙感圖像分類的準確率。
基于旋轉目標感知網絡的SAR船舶檢測方法由王梓懿、尹嘉豪、黃博斌合作完成。為了解決目標尺寸變化多樣的問題,該方法主干網絡使用基于多尺度 Transformer 架構的 PVTv2,可以更好地保留特征圖的局部連續性,同時更好地融合圖像的多尺度特征。同時,為了解決目標有多種方向且訓練樣本數量有限的問題,將旋轉邊界框與 RetinaNet 結合,有效減少了背景冗余以及噪聲的干擾。
基于Transformer和通道混合并行卷積的高光譜圖像去噪方法由胡帥、龔卓然、上官心語合作完成,模型包括三個關鍵模塊:通道混合特征提取模塊、基于塊下采樣的全局增強模塊和自適應雙向特征融合模塊。通過這三個模塊的相互作用,可以充分結合全局和局部的特征信息,處理不同區域中的噪聲和紋理差異,有效提高模型對空間細節信息的恢復能力。
目前,這三個工作分別被推薦到《中國圖象圖形學報》和《北京航空航天大學學報》發表。
2023中國多媒體大會由中國計算機學會(CCF)、中國圖像圖形學學會(CSIG)主辦,CCF多媒體技術專業委員會、CSIG多媒體專業委員會、云南大學承辦,昆明理工大學、云南師范大學和云南民族大學聯合承辦,參會人數超過1000人,通過面對面交流,共同促進多媒體領域的蓬勃發展。