12.1.4.4.1 RGB and Thermal Fusion for Object Extraction

Chapter Contents (Back)
Sensor Fusion. Infrared. RGB-T Object Detection. Thermal Imaging. Object Detection.
See also Multi-Modal Object Detection.

Gautam, R.S., Singh, D., Mittal, A.,
A fuzzy logic approach to detect hotspots with NOAA/AVHRR image using multi-channel information fusion technique,
SIViP(1), No. 4, October 2007, pp. 347-357.
Springer DOI 0711
BibRef

Nagla, K.S., Singh, D., Uddin, M.,
Sensor fusion framework for robust occupancy grid mapping,
AIPR13(1-8)
IEEE DOI 1408
fuzzy set theory BibRef

Nagla, K.S., Uddin, M.[Moin], Singh, D.[Dilbag], Kumar, R.[Rajeev],
Object identification in dynamic environment using sensor fusion,
AIPR10(1-4).
IEEE DOI 1010
BibRef

Ulusoy, I., Yuruk, H.,
New method for the fusion of complementary information from infrared and visual images for object detection,
IET-IPR(5), No. 1, February 2011, pp. 36-48.
DOI Link 1103
BibRef

Zhang, Q., Huang, N., Yao, L., Zhang, D., Shan, C., Han, J.,
RGB-T Salient Object Detection via Fusing Multi-Level CNN Features,
IP(29), 2020, pp. 3321-3335.
IEEE DOI 2002
RGB-T salient object detection, adjacent-depth feature combination, multi-branch group fusion, joint attention guided bi-directional message passing BibRef

Tu, Z.Z.[Zheng-Zheng], Li, Z.[Zhun], Li, C.L.[Cheng-Long], Lang, Y.[Yang], Tang, J.[Jin],
Multi-Interactive Dual-Decoder for RGB-Thermal Salient Object Detection,
IP(30), 2021, pp. 5678-5691.
IEEE DOI 2106
Decoding, Feature extraction, Object detection, Semantics, Fuses, Task analysis, Streaming media, Salient object detection, multiple interactions BibRef

Zhou, W.J.[Wu-Jie], Liu, J.F.[Jin-Fu], Lei, J.S.[Jing-Sheng], Yu, L.[Lu], Hwang, J.N.[Jenq-Neng],
GMNet: Graded-Feature Multilabel-Learning Network for RGB-Thermal Urban Scene Semantic Segmentation,
IP(30), 2021, pp. 7790-7802.
IEEE DOI 2109
Image segmentation, Semantics, Feature extraction, Decoding, Temperature sensors, Robot sensing systems, Motion segmentation, refinement strategy BibRef

Xiao, X.W.[Xiao-Wu], Wang, B.[Bo], Miao, L.J.[Ling-Juan], Li, L.H.[Lin-Hao], Zhou, Z.Q.[Zhi-Qiang], Ma, J.L.[Jin-Lei], Dong, D.D.[Dan-Dan],
Infrared and Visible Image Object Detection via Focused Feature Enhancement and Cascaded Semantic Extension,
RS(13), No. 13, 2021, pp. xx-yy.
DOI Link 2107
BibRef

Zhou, H.[Hang], Sun, M.[Min], Ren, X.[Xiang], Wang, X.Y.[Xiu-Yuan],
Visible-Thermal Image Object Detection via the Combination of Illumination Conditions and Temperature Information,
RS(13), No. 18, 2021, pp. xx-yy.
DOI Link 2109
BibRef

Wang, Q.W.[Qing-Wang], Chi, Y.[Yongke], Shen, T.[Tao], Song, J.[Jian], Zhang, Z.F.[Zi-Feng], Zhu, Y.[Yan],
Improving RGB-Infrared Object Detection by Reducing Cross-Modality Redundancy,
RS(14), No. 9, 2022, pp. xx-yy.
DOI Link 2205
BibRef
And:
Improving Rgb-Infrared Pedestrian Detection by Reducing Cross-Modality Redundancy,
ICIP22(526-530)
IEEE DOI 2211
Adaptation models, Fuses, Redundancy, Lighting, Detectors, Feature extraction, Minimization, RGB-Infrared images, mutual information minimization BibRef

An, Z.J.[Zi-Jia], Liu, C.L.[Chun-Lei], Han, Y.Q.[Yu-Qi],
Effectiveness Guided Cross-Modal Information Sharing for Aligned RGB-T Object Detection,
SPLetters(29), 2022, pp. 2562-2566.
IEEE DOI 2301
Feature extraction, Information sharing, Correlation, Interference, Object detection, Data mining, Visualization, modal effectiveness guiding BibRef

Dong, S.H.[Shao-Hua], Zhou, W.[Wujie], Qian, X.H.[Xiao-Hong], Yu, L.[Lu],
GEBNet: Graph-Enhancement Branch Network for RGB-T Scene Parsing,
SPLetters(29), 2022, pp. 2273-2277.
IEEE DOI 2212
Semantics, Convolution, Fuses, Feature extraction, Real-time systems, Deep learning, graph neural network, scene parsing BibRef

Wu, W.[Wei], Chu, T.[Tao], Liu, Q.[Qiong],
Complementarity-aware cross-modal feature fusion network for RGB-T semantic segmentation,
PR(131), 2022, pp. 108881.
Elsevier DOI 2208
RGB-T, Cross-modal fusion, Multi-supervision, Semantic segmentation BibRef

Wang, J.[Jie], Song, K.C.[Ke-Chen], Bao, Y.Q.[Yan-Qi], Huang, L.M.[Li-Ming], Yan, Y.H.[Yun-Hui],
CGFNet: Cross-Guided Fusion Network for RGB-T Salient Object Detection,
CirSysVideo(32), No. 5, May 2022, pp. 2949-2961.
IEEE DOI 2205
Feature extraction, Decoding, Object detection, Semantics, Image edge detection, Task analysis, Image segmentation, cross-level enhancement BibRef

Huo, F.S.[Fu-Shuo], Zhu, X.G.[Xue-Gui], Zhang, L.[Lei], Liu, Q.F.[Qi-Feng], Shu, Y.[Yu],
Efficient Context-Guided Stacked Refinement Network for RGB-T Salient Object Detection,
CirSysVideo(32), No. 5, May 2022, pp. 3111-3124.
IEEE DOI 2205
Feature extraction, Task analysis, Fuses, Object detection, Image segmentation, Semantics, Lighting, Salient object detection, information fusion BibRef

Zhang, Q.[Qiang], Xi, R.[Ruida], Xiao, T.L.[Tong-Lin], Huang, N.C.[Nian-Chang], Luo, Y.J.[Yong-Jiang],
Enabling Modality Interactions for RGB-T Salient Object Detection,
CVIU(222), 2022, pp. 103514.
Elsevier DOI 2209
RGB-T salient object detection, Modality interactions, Scale interactions
See also Lightweight Cross-Modal Transformer for RGB-D Salient Object Detection. BibRef

Yang, Y.[Yang], Huang, N.C.[Nian-Chang], Zhang, Q.[Qiang], Han, J.G.[Jun-Gong], Huang, J.[Jin],
Modality Adaptive Network for Arbitrary Modality Salient Object Detection,
MultMed(28), 2026, pp. 3214-3227.
IEEE DOI 2605
Feature extraction, Frequency modulation, Object detection, Adaptive systems, Translation, Manufacturing, Electronic equipment, salient object detection BibRef

Chen, G.[Gang], Shao, F.[Feng], Chai, X.L.[Xiong-Li], Chen, H.W.[Hang-Wei], Jiang, Q.P.[Qiu-Ping], Meng, X.C.[Xiang-Chao], Ho, Y.S.[Yo-Sung],
CGMDRNet: Cross-Guided Modality Difference Reduction Network for RGB-T Salient Object Detection,
CirSysVideo(32), No. 9, September 2022, pp. 6308-6323.
IEEE DOI 2209
Feature extraction, Image edge detection, Task analysis, Object detection, Transformers, Semantics, Visualization, transformer BibRef

Pang, Y.[Yu], Wu, H.[Hao], Wu, C.D.[Cheng-Dong],
Cross-modal co-feedback cellular automata for RGB-T saliency detection,
PR(135), 2023, pp. 109138.
Elsevier DOI 2212
RGB-T saliency detection, Cellular automata, Cross-modal co-feedback framework, Pixel-wise refinement BibRef

Cong, R.M.[Run-Min], Zhang, K.[Kepu], Zhang, C.[Chen], Zheng, F.[Feng], Zhao, Y.[Yao], Huang, Q.M.[Qing-Ming], Kwong, S.[Sam],
Does Thermal Really Always Matter for RGB-T Salient Object Detection?,
MultMed(25), 2023, pp. 6971-6982.
IEEE DOI 2311
BibRef

Li, G.Y.[Gong-Yang], Wang, Y.[Yike], Liu, Z.[Zhi], Zhang, X.P.[Xin-Peng], Zeng, D.[Dan],
RGB-T Semantic Segmentation With Location, Activation, and Sharpening,
CirSysVideo(33), No. 3, March 2023, pp. 1223-1235.
IEEE DOI 2303
Semantics, Feature extraction, Image segmentation, Decoding, Lighting, Optical fibers, Collaboration, edge sharpening BibRef

Zhao, S.[Shenlu], Zhang, Q.[Qiang],
A Feature Divide-and-Conquer Network for RGB-T Semantic Segmentation,
CirSysVideo(33), No. 6, June 2023, pp. 2892-2905.
IEEE DOI 2306
Feature extraction, Semantic segmentation, Data mining, Semantics, Lighting, Decoding, Thermal sensors, RGB-T semantic segmentation, multi-scale contextual information BibRef

Zhao, Y.[Ying], Song, K.[Kechen], Cui, W.Q.[Wen-Qi], Ren, H.[Hang], Yan, Y.H.[Yun-Hui],
MFS enhanced SAM: Achieving superior performance in bimodal few-shot segmentation,
JVCIR(97), 2023, pp. 103946.
Elsevier DOI Code:
WWW Link. 2312
Segment anything, Few-shot segmentation, RGB-T SAM, Gated prediction selection BibRef

Ju, M.[Mingye], He, C.M.[Chun-Ming], Liu, J.[Juping], Kang, B.[Bin], Su, J.[Jian], Zhang, D.Y.[Deng-Yin],
IVF-Net: An Infrared and Visible Data Fusion Deep Network for Traffic Object Enhancement in Intelligent Transportation Systems,
ITS(24), No. 1, January 2023, pp. 1220-1234.
IEEE DOI 2301
Task analysis, Feature extraction, Data integration, Intelligent transportation systems, Data models, Image fusion, visible image BibRef

Wu, J.[Jiawen], Shen, T.[Tao], Wang, Q.W.[Qing-Wang], Tao, Z.M.[Zhi-Min], Zeng, K.[Kai], Song, J.[Jian],
Local Adaptive Illumination-Driven Input-Level Fusion for Infrared and Visible Object Detection,
RS(15), No. 3, 2023, pp. xx-yy.
DOI Link 2302
BibRef

Ben-Shoushan, R.[Ravit], Brook, A.[Anna],
Fused Thermal and RGB Imagery for Robust Detection and Classification of Dynamic Objects in Mixed Datasets via Pre-Trained High-Level CNN,
RS(15), No. 3, 2023, pp. xx-yy.
DOI Link 2302
BibRef

Hu, S.M.[Shu-Ming], Zhao, F.[Fei], Lu, H.Z.[Huan-Zhang], Deng, Y.J.[Ying-Jie], Du, J.M.[Jin-Ming], Shen, X.L.[Xing-Lin],
Improving YOLOv7-Tiny for Infrared and Visible Light Image Object Detection on Drones,
RS(15), No. 13, 2023, pp. 3214.
DOI Link 2307
BibRef

Zhu, Y.H.[Yao-Hui], Sun, X.Y.[Xiao-Yu], Wang, M.[Miao], Huang, H.[Hua],
Multi-Modal Feature Pyramid Transformer for RGB-Infrared Object Detection,
ITS(24), No. 9, September 2023, pp. 9984-9995.
IEEE DOI 2310
BibRef

Sun, X.Y.[Xiao-Yu], Zhu, Y.H.[Yao-Hui], Huang, H.[Hua],
Specificity-Guided Cross-Modal Feature Reconstruction for RGB-Infrared Object Detection,
ITS(26), No. 1, January 2025, pp. 950-961.
IEEE DOI Code:
WWW Link. 2501
Feature extraction, Object detection, Image reconstruction, Fuses, Lighting, Correlation, Proposals, Detection algorithms, multi-modal fusion BibRef

He, M.Z.[Ming-Zhou], Wu, Q.B.[Qing-Bo], Ngan, K.N.[King Ngi], Jiang, F.[Feng], Meng, F.M.[Fan-Man], Xu, L.F.[Lin-Feng],
Misaligned RGB-Infrared Object Detection via Adaptive Dual-Discrepancy Calibration,
RS(15), No. 19, 2023, pp. 4887.
DOI Link 2310
BibRef

Zhou, W.[Wujie], Zhu, Y.[Yun], Lei, J.S.[Jing-Sheng], Yang, R.W.[Rong-Wang], Yu, L.[Lu],
LSNet: Lightweight Spatial Boosting Network for Detecting Salient Objects in RGB-Thermal Images,
IP(32), 2023, pp. 1329-1340.
IEEE DOI 2303
Transfer learning, Boosting, Semantics, Prediction algorithms, Mobile handsets, Manifolds, Graphics processing units, efficient salient object detection BibRef

Zhou, H.[Heng], Tian, C.[Chunna], Zhang, Z.X.[Zhen-Xi], Li, C.Y.[Cheng-Yang], Ding, Y.X.[Yu-Xuan], Xie, Y.Q.[Yong-Qiang], Li, Z.B.[Zhong-Bo],
Position-Aware Relation Learning for RGB-Thermal Salient Object Detection,
IP(32), 2023, pp. 2593-2607.
IEEE DOI 2305
Transformers, Feature extraction, Decoding, Object detection, Merging, Task analysis, Level set, Salient object detection, position-aware relation learning BibRef

Zhou, H.[Heng], Tian, C.[Chunna], Zhang, Z.X.[Zhen-Xi], Li, C.Y.[Cheng-Yang], Xie, Y.Q.[Yong-Qiang], Li, Z.B.[Zhong-Bo],
Frequency-Aware Feature Aggregation Network with Dual-Task Consistency for RGB-T Salient Object Detection,
PR(146), 2024, pp. 110043.
Elsevier DOI 2311
RGB-thermal, Salient object detection, Frequency feature aggregation, Dual-task consistency BibRef

Zhou, H.[Heng], Hong, W.T.[Wan-Ting], Zhang, Z.X.[Zhen-Xi], Liu, X.X.[Xiao-Xiong], Wu, X.J.[Xiao-Jun],
Lightweight Spatial-Channel-Frequency Network for RGB-Thermal Salient Object Detection,
SPLetters(32), 2025, pp. 4009-4013.
IEEE DOI 2511
Semantics, Feature extraction, Visualization, Robustness, Object detection, Discrete cosine transforms, Silicon, complementary information BibRef

Feng, H.T.[Hang-Tao], Zhang, L.[Lu], Zhang, S.Q.[Si-Qi], Wang, D.[Dong], Yang, X.[Xu], Liu, Z.Y.[Zhi-Yong],
RTDOD: A large-scale RGB-thermal domain-incremental object detection dataset for UAVs,
IVC(140), 2023, pp. 104856.
Elsevier DOI Code:
WWW Link. 2312
Domain-incremental object detection, Dataset, RGB-T dataset, Object detection dataset, UAVs dataset, Object detection BibRef

Wang, Y.[Yike], Li, G.Y.[Gong-Yang], Liu, Z.[Zhi],
SGFNet: Semantic-Guided Fusion Network for RGB-Thermal Semantic Segmentation,
CirSysVideo(33), No. 12, December 2023, pp. 7737-7748.
IEEE DOI Code:
WWW Link. 2312
BibRef

Zhou, W.[Wujie], Zhang, H.[Han], Yan, W.Q.[Wei-Qing], Lin, W.S.[Wei-Si],
MMSMCNet: Modal Memory Sharing and Morphological Complementary Networks for RGB-T Urban Scene Semantic Segmentation,
CirSysVideo(33), No. 12, December 2023, pp. 7096-7108.
IEEE DOI Code:
WWW Link. 2312
BibRef

Lv, Y.[Ying], Liu, Z.[Zhi], Li, G.Y.[Gong-Yang],
Context-Aware Interaction Network for RGB-T Semantic Segmentation,
MultMed(26), 2024, pp. 6348-6360.
IEEE DOI 2404
Semantic segmentation, Feature extraction, Semantics, Task analysis, Transformers, Context modeling, Solid modeling, RGB-T semantic segmentation BibRef

Dong, S.H.[Shao-Hua], Zhou, W.[Wujie], Xu, C.[Caie], Yan, W.Q.[Wei-Qing],
EGFNet: Edge-Aware Guidance Fusion Network for RGB-Thermal Urban Scene Parsing,
ITS(25), No. 1, January 2024, pp. 657-669.
IEEE DOI 2402
Feature extraction, Semantics, Data mining, Image edge detection, Fuses, Task analysis, Visualization, Deep supervision, edge map, RGB-thermal urban scene parsing BibRef

Jiang, X.R.[Xiu-Rong], Hou, Y.F.[Yi-Fan], Tian, H.[Hui], Zhu, L.[Lin],
Mirror complementary transformer network for RGB-thermal salient object detection,
IET-CV(18), No. 1, 2024, pp. 15-32.
DOI Link Code:
WWW Link. 2403
image segmentation, object detection BibRef

Zhang, R.H.[Rui-Heng], Li, L.[Lu], Zhang, Q.[Qi], Zhang, J.[Jin], Xu, L.X.[Li-Xin], Zhang, B.M.[Bao-Min], Wang, B.L.[Bing-Lu],
Differential Feature Awareness Network Within Antagonistic Learning for Infrared-Visible Object Detection,
CirSysVideo(34), No. 8, August 2024, pp. 6735-6748.
IEEE DOI 2408
Feature extraction, Object detection, Videos, Data mining, Semantics, Pedestrians, Image color analysis, multi-modal feature fusion BibRef

Wang, J.[Jue], Lin, Y.X.[Yu-Xiang], Zhao, Q.[Qi], Luo, D.[Dong], Chen, S.[Shuaibao], Chen, W.[Wei], Peng, X.J.[Xiao-Jiang],
Invisible gas detection: An RGB-thermal cross attention network and a new benchmark,
CVIU(248), 2024, pp. 104099.
Elsevier DOI Code:
WWW Link. 2409
Gas detection, RGB-Thermal, Gas-DB BibRef

Li, W.[Wuxin], Chen, Q.[Qian], Gu, G.H.[Guo-Hua], Sui, X.[Xiubao],
Object matching of visible-infrared image based on attention mechanism and feature fusion,
PR(158), 2025, pp. 110972.
Elsevier DOI 2411
Siamese network, Infrared image, Visible image, Image match, Feature fusion BibRef

Han, Q.Q.[Qian-Qian], Xi, R.P.[Run-Ping], Chen, Q.[Qian],
Infrared and Visible Image Fusion Based on Biological Vision,
ICIVC22(694-701)
IEEE DOI 2301
Visualization, Fuses, Convolution, Feature extraction, Decoding, Biological information theory, Image fusion, Biological Vision, Dual-mode cellular mechanism BibRef

Yang, Q.M.[Qi-Min], Ren, K.[Kan], Chen, Q.[Qian],
AMSFusion: An Adaptive Multi-Scale Infrared and Visible Image Fusion Network Based on Attention Mechanisms,
CirSysVideo(36), No. 1, January 2026, pp. 653-668.
IEEE DOI 2602
Feature extraction, Image fusion, Transformers, Training, Computational modeling, Computational efficiency, Autoencoders, adaptive fusion BibRef

Xu, Q.Q.[Qi-Qi], Di, Z.G.[Zhen-Guang], Dong, H.Y.[Hao-Yu], Yang, G.[Gang],
Feature differences reduction and specific features preserving network for RGB-T salient object detection,
IVC(152), 2024, pp. 105302.
Elsevier DOI Code:
WWW Link. 2412
RGB-T salient object detection, Modality differences, Specific features, Multi-modal fusion BibRef

Lai, W.J.[Wen-Jie], Zeng, F.[Fanyu], Hu, X.[Xiao], He, S.W.[Shao-Wei], Liu, Z.J.[Zi-Ji], Jiang, Y.D.[Ya-Dong],
RegSeg: An End-to-End Network for Multimodal RGB-Thermal Registration and Semantic Segmentation,
IP(33), 2024, pp. 6676-6690.
IEEE DOI 2412
Semantic segmentation, Accuracy, Semantics, Deformation, Feature extraction, Registers, Real-time systems, Noise, shared encoder BibRef

Luo, Y.[Yi], Shao, F.[Feng], Mu, B.Y.[Bao-Yang], Chen, H.W.[Hang-Wei], Li, Z.[Zhuo], Jiang, Q.P.[Qiu-Ping],
Dynamic Weighted Fusion and Progressive Refinement Network for Visible-Depth-Thermal Salient Object Detection,
CirSysVideo(34), No. 11, November 2024, pp. 10662-10677.
IEEE DOI 2412
Feature extraction, Task analysis, Object detection, Decoding, Semantics, Lighting, Data mining, triple-modal fusion BibRef

Zeng, Y.Q.[Yu-Qiao], Liang, T.F.[Teng-Fei], Jin, Y.[Yi], Li, Y.D.[Yi-Dong],
MMI-Det: Exploring Multi-Modal Integration for Visible and Infrared Object Detection,
CirSysVideo(34), No. 11, November 2024, pp. 11198-11213.
IEEE DOI 2412
Feature extraction, Image fusion, Object detection, Task analysis, Optimization, Data mining, Fourier transformation BibRef

Wang, S.[Shuo], Yang, G.[Gang], Xu, Q.Q.[Qi-Qi], Dai, X.[Xun],
Leveraging modality-specific and shared features for RGB-T salient object detection,
IET-CV(18), No. 8, 2024, pp. 1285-1299.
DOI Link Code:
WWW Link. 2501
learning (artificial intelligence) BibRef

Chen, L.[Liang], Zhong, B.[Bineng], Liang, Q.H.[Qi-Hua], Zheng, Y.Z.[Yao-Zong], Mo, Z.Y.[Zhi-Yi], Song, S.X.[Shu-Xiang],
Top-Down Cross-Modal Guidance for Robust RGB-T Tracking,
CirSysVideo(34), No. 12, December 2024, pp. 12388-12398.
IEEE DOI 2501
Target tracking, Feature extraction, Decoding, Task analysis, Transformers, Visualization, Encoding, Multi-modal tracking, single-object tracking BibRef

Wei, C.H.[Chi-Heng], Bai, L.[Lianfa], Chen, X.Y.[Xiao-Yu], Han, J.[Jing],
Cross-Modality Data Augmentation for Aerial Object Detection with Representation Learning,
RS(16), No. 24, 2024, pp. 4649.
DOI Link 2501
BibRef

Peng, F.G.[Feng-Guang], Ding, Z.[Zihan], Chen, Z.M.[Zi-Ming], Wang, G.[Gang], Hui, T.R.[Tian-Rui], Liu, S.[Si], Shi, H.[Hang],
Region-adaptive and context-complementary cross modulation for RGB-T semantic segmentation,
PR(147), 2024, pp. 110092.
Elsevier DOI 2312
RGB-Thermal, Semantic segmentation, Region-Adaptive Channel Modulation, Context-Complementary Spatial Modulation BibRef

Bao, L.X.[Liu-Xin], Zhou, X.F.[Xiao-Fei], Zheng, B.[Bolun], Cong, R.M.[Run-Min], Yin, H.B.[Hai-Bing], Zhang, J.Y.[Ji-Yong], Yan, C.G.[Cheng-Gang],
IFENet: Interaction, Fusion, and Enhancement Network for V-D-T Salient Object Detection,
IP(34), 2025, pp. 483-494.
IEEE DOI Code:
WWW Link. 2501
Visible-depth-thermal. V-D-T. Feature extraction, Object detection, Correlation, Logic gates, Decoding, Transformers, Semantics, Cognition, Visualization, Fuses, enhancement BibRef

Zhu, Y.B.[Ya-Bin], Wang, Q.W.[Qian-Wu], Li, C.L.[Cheng-Long], Tang, J.[Jin], Gu, C.J.[Cheng-Jie], Huang, Z.X.[Zhi-Xiang],
Visible-thermal multiple object tracking: Large-scale video dataset and progressive fusion approach,
PR(161), 2025, pp. 111330.
Elsevier DOI Code:
WWW Link. 2502
Visible-thermal multiple object tracking, Progressive fusion, Large-scale video dataset BibRef

Chen, Y.[Yu], Li, X.[Xiang], Luan, C.[Chao], Hou, W.M.[Wei-Min], Liu, H.C.[Hao-Chen], Zhu, Z.[Zihui], Xue, L.[Lian], Zhang, J.Q.[Jian-Qi], Liu, D.[Delian], Wu, X.[Xin], Wei, L.F.[Lin-Fang], Jian, C.C.[Chao-Chao], Li, J.Z.[Jin-Ze],
Cross-level interaction fusion network-based RGB-T semantic segmentation for distant targets,
PR(161), 2025, pp. 111218.
Elsevier DOI 2502
Semantic segmentation, Feature fusion, Cross modality, Multi-scale information, Distant object BibRef

Zhao, S.[Shenlu], Li, J.Y.[Jing-Yi], Zhang, Q.[Qiang],
C^4Net: Excavating Cross-Modal Context- and Content-Complementarity for RGB-T Semantic Segmentation,
CirSysVideo(35), No. 2, February 2025, pp. 1347-1361.
IEEE DOI 2502
Semantic segmentation, Feature extraction, Excavation, Decoding, Semantics, Thermal sensors, Automobiles, Data mining, semantic gaps BibRef

Yi, S.[Shi], Chen, M.T.[Meng-Ting], Yuan, X.S.[Xue-Song], Guo, S.[Si], Wang, J.[Jiashuai],
An interactive fusion attention-guided network for ground surface hot spring fluids segmentation in dual-spectrum UAV images,
PandRS(220), 2025, pp. 661-691.
Elsevier DOI Code:
WWW Link. 2502
Ground surface hot spring fluids, Dual-spectrum UAV images, RGB-Thermal (RGB-T) semantic segmentation, Hybrid consistency learning strategy BibRef

Zhou, W.[Wujie], Gong, T.T.[Ting-Ting], Yan, W.Q.[Wei-Qing],
Knowledge Distillation SegFormer-Based Network for RGB-T Semantic Segmentation,
SMCS(55), No. 3, March 2025, pp. 2170-2182.
IEEE DOI Code:
WWW Link. 2502
Feature extraction, Semantic segmentation, Semantics, Knowledge engineering, Convolutional neural networks, Accuracy, transformer BibRef

Zhao, S.[Shenlu], Jin, Z.[Ziniu], Jiao, Q.[Qiang], Zhang, Q.[Qiang], Han, J.G.[Jun-Gong],
Resolving semantic conflicts in RGB-T semantic segmentation,
PR(162), 2025, pp. 111398.
Elsevier DOI 2503
RGB-T semantic segmentation, Semantic conflicts, Complementary information, Global contextual information BibRef

Liu, J.Y.[Jin-Yuan], Wu, G.Y.[Guan-Yao], Liu, Z.[Zhu], Wang, D.[Di], Jiang, Z.Y.[Zhi-Ying], Ma, L.[Long], Zhong, W.[Wei], Fan, X.[Xin], Liu, R.S.[Ri-Sheng],
Infrared and Visible Image Fusion: From Data Compatibility to Task Adaption,
PAMI(47), No. 4, April 2025, pp. 2349-2369.
IEEE DOI 2503
Image fusion, Visualization, Surveys, Meters, Object detection, Feature extraction, Taxonomy, Semantic segmentation, object detection BibRef

Liu, J.Y.[Jin-Yuan], Fan, X.[Xin], Huang, Z.[Zhanbo], Wu, G.Y.[Guan-Yao], Liu, R.S.[Ri-Sheng], Zhong, W.[Wei], Luo, Z.X.[Zhong-Xuan],
Target-aware Dual Adversarial Learning and a Multi-scenario Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection,
CVPR22(5792-5801)
IEEE DOI 2210
Visualization, Fuses, Object detection, Benchmark testing, Adversarial machine learning, Sensor systems, Datasets and evaluation BibRef

Ming, R.[Rui], Xiao, Y.X.[Yi-Xian], Liu, X.Y.[Xin-Yu], Zheng, G.L.[Guo-Long], Xiao, G.B.[Guo-Bao],
SSDFusion: A scene-semantic decomposition approach for visible and infrared image fusion,
PR(163), 2025, pp. 111457.
Elsevier DOI Code:
WWW Link. 2503
Image fusion, Feature decomposition, Semantic awareness BibRef

Wang, J.[Jie], Li, G.Q.[Guo-Qiang], Yu, H.J.[Hong-Jie], Xi, J.W.[Jin-Wen], Shi, J.[Jie], Wu, X.Y.[Xue-Ying],
Intra-Modality Self-Enhancement Mirror Network for RGB-T Salient Object Detection,
CirSysVideo(35), No. 3, March 2025, pp. 2513-2525.
IEEE DOI 2503
Imaging, Feature extraction, Decoding, Sensors, Object detection, Interpolation, Thermal sensors, Mirrors, intra-modality self-enhancement BibRef

Liu, J.[Jinfu], Liu, H.[Hong], Li, X.[Xia], Ren, J.[Jiale], Xu, X.H.[Xin-Hua],
MiLNet: Multiplex Interactive Learning Network for RGB-T Semantic Segmentation,
IP(34), 2025, pp. 1686-1699.
IEEE DOI Code:
WWW Link. 2503
Feature extraction, Semantic segmentation, Semantics, Multiplexing, Decoding, Representation learning, Transformers, Training, Lighting, asymmetric simulated learning BibRef

Meng, F.Z.[Fang-Zhou], Hong, A.[Aoping], Tang, H.Y.[Hong-Ying], Tong, G.[Guanjun],
FQDNet: A Fusion-Enhanced Quad-Head Network for RGB-Infrared Object Detection,
RS(17), No. 6, 2025, pp. 1095.
DOI Link 2503
BibRef

Zhou, W.[Wujie], Wu, H.P.[Hong-Ping], Jiang, Q.P.[Qiu-Ping],
MDNet: Mamba-Effective Diffusion-Distillation Network for RGB-Thermal Urban Dense Prediction,
CirSysVideo(35), No. 4, April 2025, pp. 3222-3233.
IEEE DOI Code:
WWW Link. 2504
Computational modeling, Adaptation models, Predictive models, Image segmentation, Accuracy, Semantics, self-distillation BibRef

Tian, L.Y.[Ling-Yun], Shen, Q.[Qiang], Deng, Z.L.[Zi-Long], Gao, Y.[Yang], Wang, S.[Simiao],
Mask-Guided Cross-Modality Fusion Network for Visible-Infrared Vehicle Detection,
SPLetters(32), 2025, pp. 1815-1819.
IEEE DOI 2505
Feature extraction, Vehicle detection, Hafnium, Frequency modulation, Training, Meteorology, Head, Decoding, location-sensitive masked autoencoder BibRef

Zhou, X.F.[Xiao-Fei], Wu, X.L.[Xiao-Ling], Bao, L.[Liuxin], Yin, H.B.[Hai-Bing], Jiang, Q.P.[Qiu-Ping], Zhang, J.Y.[Ji-Yong],
AGFNet: Adaptive Gated Fusion Network for RGB-T Semantic Segmentation,
ITS(26), No. 5, May 2025, pp. 6477-6492.
IEEE DOI 2505
Semantic segmentation, Logic gates, Image edge detection, Decoding, Fuses, Feature extraction, Aggregates, Adaptive systems, Semantics, cross-modal BibRef

Hou, J.[Jia], Wen, H.F.[Hong-Fa], Wang, S.[Shuai], Yan, C.G.[Cheng-Gang],
I3Net: Intensive information interaction network for RGB-T salient object detection,
IVC(158), 2025, pp. 105525.
Elsevier DOI 2505
RGB-T salient object detection, Cross-modality fusion, Feature selection, Direction-aware attention, Intensive interaction BibRef

Zhao, C.H.[Chun-Hui], Wang, W.X.[Wen-Xuan], Yan, Y.M.[Yi-Ming], Ge, B.Y.[Bao-Yu], Hou, W.[Wei], Gao, F.J.[Feng-Jiao],
A Re-Identification Framework for Visible and Thermal-Infrared Aerial Remote Sensing Images with Large Differences of Elevation Angles,
RS(17), No. 11, 2025, pp. 1956.
DOI Link 2506
BibRef

Ying, X.[Xinyi], Xiao, C.[Chao], An, W.[Wei], Li, R.J.[Ruo-Jing], He, X.[Xu], Li, B.Y.[Bo-Yang], Cao, X.[Xu], Li, Z.X.[Zhao-Xu], Wang, Y.Q.[Ying-Qian], Hu, M.Y.[Ming-Yuan], Xu, Q.Y.[Qing-Yu], Lin, Z.P.[Zai-Ping], Li, M.[Miao], Zhou, S.L.[Shi-Lin], Liu, L.[Li], Sheng, W.D.[Wei-Dong],
Visible-Thermal Tiny Object Detection: A Benchmark Dataset and Baselines,
PAMI(47), No. 7, July 2025, pp. 6088-6096.
IEEE DOI 2506
Object detection, Benchmark testing, Measurement, Annotations, Roads, Performance evaluation, Weight measurement, Training, benchmark dataset BibRef

Hu, K.[Ke], He, Y.D.[Yu-Dong], Li, Y.[Yuan], Zhao, J.Y.[Jia-Yu], Chen, S.[Song], Kang, Y.[Yi],
EI²Det: Edge-Guided Illumination-Aware Interactive Learning for Visible-Infrared Object Detection,
CirSysVideo(35), No. 7, July 2025, pp. 7101-7115.
IEEE DOI Code:
WWW Link. 2507
Lighting, Object detection, Image edge detection, Feature extraction, Autonomous vehicles, Meteorology, Image fusion, autonomous driving BibRef

Huang, J.Y.[Jun-Yu], Lian, J.L.[Jia-Ling], Cao, F.Y.[Fang-Yu], Chen, J.W.[Jia-Wei], Luo, R.[Renbo], Yang, J.X.[Jin-Xin], Shi, Q.[Qian],
PONet: A Compact RGB-IR Fusion Network for Vehicle Detection on OrangePi AIpro,
RS(17), No. 15, 2025, pp. 2650.
DOI Link 2508
BibRef

Yin, H.Q.[Han-Qi], Zhang, L.G.[Li-Guo], Sun, Y.M.[Yi-Ming], Yin, G.S.[Gui-Sheng],
ERTFNet: Enhanced RGB-T Fusion Network for semantic segmentation by integrating thermal edge features,
CVIU(259), 2025, pp. 104421.
Elsevier DOI 2509
Semantic segmentation, RGB-T Fusion, Edge extraction BibRef

Liu, C.[Chang], Liu, H.Z.[Hai-Zhuang], Zhuo, J.[Junbao], Zou, B.[Bochao], Chen, J.S.[Jian-Sheng], Zhao, Q.[Qianchuan], Ma, H.M.[Hui-Min],
Implicit alignment and query refinement for RGB-T semantic segmentation,
PR(169), 2026, pp. 111951.
Elsevier DOI Code:
WWW Link. 2509
RGB-T semantic segmentation, Implicit alignment, Query refinement BibRef

Guo, Y.X.[Yi-Xin], Chen, Z.X.[Zhen-Xue], Rong, X.W.[Xue-Wen], Liu, C.Y.[Cheng-Yun], Song, L.[Lili], Li, Y.[Yidi],
3CNet: Cross-modal cooperative correction network for RGB-T semantic segmentation,
IVC(161), 2025, pp. 105638.
Elsevier DOI Code:
WWW Link. 2509
Cross-modal cooperative correction, RGB-T semantic segmentation, Multi-modal feature fusion, Attention mechanisms BibRef

An, G.H.[Guan-Hua], Geng, Y.[Yuhe], Fang, S.Y.[Sheng-Yu], Guo, J.C.[Ji-Chang],
SFDFNet: Leveraging spatial-frequency deep fusion for RGB-T semantic segmentation,
IVC(161), 2025, pp. 105605.
Elsevier DOI 2509
RGB-T semantic segmentation, Multi-modality, Distinctive feature enhancement, Spatial-frequency feature fusion BibRef

Tian, C.[Chao], Yang, C.[Chao], Zhu, G.Q.[Guo-Qing], Wang, Q.[Qiang], He, Z.Y.[Zhen-Yu],
Learning a robust RGB-Thermal detector for extreme modality imbalance,
PRL(196), 2025, pp. 1-8.
Elsevier DOI 2509
RGB-Thermal, Object detection, Modality imbalance BibRef

Wang, T.[Tao], Wang, H.[Hui], Zhu, Y.L.[Yun-Li], Fan, X.[Xinang], Luo, G.L.[Guo-Liang],
Infrared-Visible Object Detection via Distillation-Fermentation Dual Processing,
SPLetters(32), 2025, pp. 3680-3684.
IEEE DOI 2510
Feature extraction, Semantics, Phase change materials, Convolution, Training, Logic gates, Data mining, Lighting, Computational modeling, object detection BibRef

Wang, L.Y.[Li-Ying], Zhang, X.L.[Xiao-Li], Jia, C.M.[Chuan-Min], Ma, S.W.[Si-Wei],
MAFS: Masked Autoencoder for Infrared-Visible Image Fusion and Semantic Segmentation,
IP(34), 2025, pp. 6490-6505.
IEEE DOI Code:
WWW Link. 2510
Image fusion, Training, Semantic segmentation, Decoding, Transformers, Semantics, Imaging, Feature extraction, Autoencoders, knowledge distillation BibRef

Wang, H.K.[Hong-Kuan], Yu, Q.X.[Qing-Xi], Di, Z.G.[Zhen-Guang], Yang, G.[Gang],
Explicit Semantic Alignment Network for RGB-T salient object detection with Hierarchical Cross-Modal Fusion,
IVC(162), 2025, pp. 105730.
Elsevier DOI Code:
WWW Link. 2510
RGB-T salient object detection, Semantic-guided, Feature alignment BibRef

Zhao, X.F.[Xiao-Feng], Zhang, H.[Hui], Li, C.X.[Chen-Xiao], Wang, K.[Kehao], Zhang, Z.[Zhili],
DVIF-Net: A Small-Target Detection Network for UAV Aerial Images Based on Visible and Infrared Fusion,
RS(17), No. 20, 2025, pp. 3411.
DOI Link 2510
BibRef

Zhou, M.L.[Ming-Liang], Li, Y.Y.[Yun-Yao], Yang, G.C.[Guang-Chao], Wei, X.K.[Xue-Kai], Pu, H.Y.[Hua-Yan], Luo, J.[Jun], Jia, W.J.[Wei-Jia],
COFNet: Contrastive Object-Aware Fusion Using Box-Level Masks for Multispectral Object Detection,
MultMed(27), 2025, pp. 7444-7458.
IEEE DOI 2510
Object detection, Feature extraction, Training, Contrastive learning, Background noise, Visualization, contrastive loss BibRef

Chen, H.J.[Hao-Jie], Wang, Z.[Zhuo], Qin, H.[Hongde], Mu, X.K.[Xiao-Kai],
CFDHI-Net: Correlation-Driven Feature Decoupling and Hierarchical Integration Network for RGB-Thermal Semantic Segmentation,
ITS(26), No. 10, October 2025, pp. 17173-17184.
IEEE DOI Code:
WWW Link. 2511
Feature extraction, Semantic segmentation, Correlation, Transformers, Accuracy, Decoding, Convolution, dual-branch VMamba backbone BibRef

Xiang, X.T.[Xian-Tai], Zhou, G.Y.[Guang-Yao], Niu, B.[Ben], Pan, Z.X.[Zong-Xu], Huang, L.[Lijia], Li, W.[Wenshuai], Wen, Z.X.[Zi-Xiao], Qi, J.[Jiamin], Gao, W.[Wanxin],
Infrared-Visible Image Fusion Meets Object Detection: Towards Unified Optimization for Multimodal Perception,
RS(17), No. 21, 2025, pp. 3637.
DOI Link 2511
BibRef

O'Donnell, K.[Kyle], Kambhamettu, C.[Chandra],
Feature Matching in the Dark: Homography-Based RGB-IR Feature Transformation for Low-Light Vision,
Odometry25(1694-1702)
IEEE DOI 2512
Deep learning, Accuracy, Computational modeling, Lighting, Estimation, Predictive models, Feature extraction, Sensors, multi-modal fusion BibRef

Yang, F.[Fan], Shao, F.[Feng], Mu, B.Y.[Bao-Yang], Chai, X.L.[Xiong-Li], Jiang, Q.P.[Qiu-Ping],
USformer: A U-Shaped Structure Transformer for RGB-Thermal Semantic Segmentation and Traffic Scene Understanding,
ITS(27), No. 1, January 2026, pp. 623-638.
IEEE DOI 2601
Semantic segmentation, Decoding, Image segmentation, Encoding, Transformers, Feature extraction, Semantics, transformer BibRef

Li, Z.Q.[Zhu-Qiang], Zhen, Z.J.[Zhi-Jun], Chen, S.B.[Sheng-Bo], Zhang, L.Q.[Li-Qiang], Cao, L.[Lisai],
Dual-Level Attention Relearning for Cross-Modality Rotated Object Detection in UAV RGB-Thermal Imagery,
RS(18), No. 1, 2026, pp. 107.
DOI Link 2601
BibRef

Wang, X.X.[Xiao-Xia], Xi, J.T.[Jiang-Tao], Yang, F.[Fengbao], Yang, Y.J.[Yun-Jia], Li, M.[Minglu],
PFI-Net: A parallel feature interaction network for infrared and visible target detection,
PR(174), 2026, pp. 113003.
Elsevier DOI 2602
Target detection, Feature extraction, Parallel feature interaction, Weighted detection boxes fusion BibRef

Zhao, T.Y.[Tian-Yi], Yuan, M.[Maoxun], Jiang, F.[Feng], Wang, N.[Nan], Wei, X.X.[Xing-Xing],
Removal Then Selection: A Coarse-to-Fine Fusion Perspective for RGB-Infrared Object Detection,
ITS(27), No. 2, February 2026, pp. 2504-2519.
IEEE DOI Code:
WWW Link. 2603
Object detection, Feature extraction, Lighting, Detectors, Information filters, Filtering theory, Representation learning, RGB-IR object detection BibRef

Hou, R.[Ruichao], Li, X.Y.[Xing-Yuan], Ren, T.W.[Tong-Wei], Zhou, D.M.[Dong-Ming], Wu, G.S.[Gang-Shan], Cao, J.[Jinde],
HyPSAM: Hybrid Prompt-Driven Segment Anything Model for RGB-Thermal Salient Object Detection,
CirSysVideo(36), No. 3, March 2026, pp. 2697-2712.
IEEE DOI Code:
WWW Link. 2603
Decoding, Object detection, Image segmentation, Convolution, Kernel, Feature extraction, Training, Computer architecture, Semantics, segment anything model BibRef

Liu, F.C.[Fang-Cen], Gao, C.Q.[Chen-Qiang], Chen, F.[Fang], Li, P.C.[Peng-Cheng], Guo, J.J.[Jun-Jie], Meng, D.Y.[De-Yu],
A Fusion-Enhanced Network for Infrared and Visible High-Level Vision Tasks,
MultMed(28), 2026, pp. 1469-1482.
IEEE DOI 2603
Object detection, Foundation models, Semantics, Semantic segmentation, Feature extraction, Training, salient object detection BibRef

Xie, Y.T.[Yu-Ting], Zhang, Z.[Zhili], Hou, Y.[Yi], Wang, P.[Puzuo], Zhang, H.X.[Han-Xiao],
Modality-Aware Dynamic Fusion for Weakly Aligned RGB-T Tiny Object Detection,
SPLetters(33), 2026, pp. 1023-1027.
IEEE DOI 2603
Object detection, Feature extraction, Decoding, Attention mechanisms, Indexes, Detectors, Benchmark testing, tiny object detection BibRef

Yi-Xin, H.[Hu], Zhiwei, Z.[Zhang], Jun, L.[Lv], Yan, Z.[Zhuang],
A multi-modal discrepancy fusion-based RGB-T segmentation network for robotic scene perception,
PRL(202), 2026, pp. 149-155.
Elsevier DOI 2603
RGB-T semantic segmentation, Coordinate attention, Multi-modal discrepancies, Feature fusion BibRef

Ma, Y.[You], Chai, L.[Lin], Mao, S.[Shihan], Zhang, Y.C.[Yu-Cheng],
Learning modality knowledge with proxy for RGB-Infrared object detection,
PR(176), 2026, pp. 113227.
Elsevier DOI 2603
RGB-Infrared object detection, Feature fusion, Mixture of experts BibRef

Xing, Y.H.[Ying-Hui], Niu, Z.L.[Zhi-Ling], Yang, S.[Shuo], Zhang, S.Z.[Shi-Zhou], Zhang, Y.N.[Yan-Ning],
Less Is More: Infrared and Visible Images Fusion via Semantic-Guided Mixture of Multi-Feature Experts,
IP(35), 2026, pp. 3381-3394.
IEEE DOI Code:
WWW Link. 2604
Feature extraction, Semantics, Image fusion, Redundancy, Image reconstruction, Semantic segmentation, mixture-of-expert BibRef

Lyu, P.F.[Peng-Fei], Yu, X.S.[Xiao-Sheng], Yeung, P.H.[Pak-Hei], Wu, C.D.[Cheng-Dong], Rajapakse, J.C.[Jagath C.],
Deep Fourier-Embedded Network for RGB and Thermal Salient Object Detection,
CirSysVideo(36), No. 4, April 2026, pp. 4226-4241.
IEEE DOI Code:
WWW Link. 2604
Transformers, Frequency-domain analysis, Feature extraction, Fast Fourier transforms, Computational modeling, salient object detection BibRef

Wu, W.C.[Wen-Cong], Zhang, H.X.[Hong-Xi], Zhang, X.W.[Xiu-Wei], Yin, H.L.[Han-Lin], Zhang, Y.N.[Yan-Ning],
Lightweight Modal-Guided Cross-Attention Fusion Network for Visible-Infrared Object Detection,
PR(177), 2026, pp. 113350.
Elsevier DOI Code:
WWW Link. 2605
Visible-infrared object detection, Lightweight network, Cross-attention, Gated fusion BibRef

Dai, X.R., Fu, L., Song, Y.L., Xu, X.M.,
MIANet: Multi-information attention network for multispectral pedestrian detection,
SP:IC(145), 2026, pp. 117555.
Elsevier DOI 2605
Multispectral pedestrian detection, Dual-stream network, Visible-thermal fusion, Attention mechanism BibRef

Wu, J.[Jiesheng], Du, J.[Ji], Hao, F.[Fangwei], Hong, J.K.[Jian-Kang],
Du-CIPT: Dual Cross-Modal Interactive Pyramid Transformer for RGB-Thermal salient object detection and segmentation,
SP:IC(145), 2026, pp. 117551.
Elsevier DOI 2605
Cross-modal pyramid, Transformer, Cross-modal purification, Multi-scale long-range interaction BibRef

Padnekar, S.M.[S. Meena], Mitra, K.[Kaushik], Das, S.[Sukhendu],
Distilling auxiliary RGB-T features for unsupervised semantic segmentation,
IVC(170), 2026, pp. 105977.
Elsevier DOI 2605
Semantic segmentation, Unsupervised learning, Multimodal data RGB-thermal, Contrastive loss BibRef

Chen, J.Y.[Jin-Yong], Zhu, T.Y.[Ting-Yu], Wang, G.[Gang],
Target-Aware Fusion: A Diffusion Model for Infrared and Visible Image Integration to Enhance Object Detection,
RS(18), No. 10, 2026, pp. 1545.
DOI Link 2605
BibRef

Gao, S.B.[Shao-Bing], Tan, M.J.[Min-Jie], Lv, S.[Shun], Liu, Y.G.[Yi-Guang], Li, Y.J.[Yong-Jie],
Infrared and Visible Image Fusion Using Bimodal Neuron and Dynamic Receptive Field Mechanisms,
IP(35), 2026, pp. 4832-4846.
IEEE DOI Code:
WWW Link. 2605
Feeds, Motion pictures, Broadcasting, Feedback, Circuits, MIMICs, Filtering, Filters, Millimeter wave integrated circuits, semantic segmentation BibRef

Gao, Y.Y.[Yao-Yue], Cheng, X.[Xinru], Li, Y.M.[Yi-Meng], Xu, D.W.[Da-Wei], Sun, D.[Desheng], Hu, Y.Y.[Yao-Yi],
ISDG-Net: Efficient RGB-Infrared Object Detection for Remote Sensing Imagery,
RS(18), No. 10, 2026, pp. 1570.
DOI Link 2605
BibRef

Yang, X.[Xun], Sun, Y.[Yaoru], Xu, C.L.[Cheng-Long], Yuan, B.[Bo], Yang, X.J.[Xue-Jie], Yang, Q.[Qunhui],
Hybrid Embedding SAM-Guided Feedback Network for RGB-Thermal Urban Scene Parsing,
SMCS(56), No. 6, June 2026, pp. 3649-3661.
IEEE DOI Code:
WWW Link. 2605
Semantics, Feature extraction, Semantic segmentation, Optimization, Collaboration, Robustness, Nonhomogeneous media, Decoding, urban scenes BibRef

Sun, Y.Q.[Yong-Qi], Dai, C.G.[Chen-Guang], Wang, H.Y.[Han-Yun], Wang, L.G.[Long-Guang], Li, W.K.[Wen-Ke], Li, M.[Meilin], Zhang, Y.S.[Yong-Sheng], Yu, A.Z.[An-Zhu],
P3D: Plug-and-play prompt-driven framework for RGB-thermal semantic segmentation,
PR(178), 2026, pp. 113429.
Elsevier DOI 2605
RGB-thermal images, Semantic segmentation, Plug-and-play, Segment anything model, Low-rank adaptation, Prompt generation BibRef

Guo, Y.X.[Yi-Xin], Chen, Z.X.[Zhen-Xue], Rong, X.W.[Xue-Wen], Liu, C.Y.[Cheng-Yun], Song, L.[Lili], Li, Y.[Yidi],
ASNet: An adaptive scene-aware network for RGB-thermal urban scene semantic segmentation,
JVCIR(118), 2026, pp. 104822.
Elsevier DOI Code:
WWW Link. 2606
Encoder-decoder network, RGB-thermal semantic segmentation, Multi-modal fusion, Scene awareness BibRef

Hou, J.[Jia], Wang, S.[Shuai], Zhao, Q.[Qiang], Ma, J.[Junbo], Sheng, X.C.[Xi-Chun], Sun, Y.Q.[Yao-Qi], Wen, H.F.[Hong-Fa], Yan, C.G.[Cheng-Gang],
Empirical Study on Fusion Strategy in RGB-T Salient Object Detection,
CirSysVideo(36), No. 6, June 2026, pp. 8316-8328.
IEEE DOI 2606
Data augmentation, Semantics, Feature extraction, Temperature, Data models, Convolution, Videos, Object detection, Lighting, Decoding, image pyramid BibRef

Zhou, W.[Wujie], Li, Y.[Yiben], Jiang, Q.P.[Qiu-Ping], Liao, L.[Liang], Cong, R.M.[Run-Min], Lin, W.S.[Wei-Si],
Decouple-Then-Synergize: A Self-Paced Collaborative Learning Network for RGB-T Snowy Urban Scene Parsing,
IP(35), 2026, pp. 5758-5772.
IEEE DOI Code:
WWW Link. 2606
Modeling, Learning (artificial intelligence), Semantic segmentation, Training, Federated learning, Labeling, snowy urban scenes BibRef

Yao, X.[Xinjie], Bi, Y.X.[Yan-Xian], Wang, Y.[Yu], Zhu, P.F.[Peng-Fei], Zhao, R.[Ruipu], Li, W.H.[Wei-Hao], Lin, W.[Wanyu], Li, K.[Kai], Hu, Q.H.[Qing-Hua],
Incomplete cross-modality class-incremental learning in visible-thermal recognition,
PR(179), 2026, pp. 113681.
Elsevier DOI 2606
Incomplete cross-modality learning, Hybrid fusion, Information flow, Class-incremental learning, Modality forgetting BibRef

Dong, W.H.[Wen-Hao], Luo, X.Y.[Xiao-Yan], Yang, L.L.[Lin-Lin], Zhu, H.D.[Hao-Dong], Shi, X.R.[Xiao-Rong], Guo, G.D.[Guo-Dong], Zhang, B.C.[Bao-Chang],
LDFE: Laplacian Decoupled Feature Enhancement block for dual-stream CNN-based RGB-IR object detection,
PR(179), 2026, pp. 113935.
Elsevier DOI 2606
RGB-IR object detection, Laplacian Pyramid, Dual-stream backbone, Global and local feature fusion BibRef

Fan, B.[Bin], Wang, J.[Jinyu], Zhao, W.[Wei], Chen, Y.J.[Yong-Jie], Liu, H.M.[Hong-Min],
Unifying RGB and thermal object detection in one detector,
PR(179), 2026, pp. 113902.
Elsevier DOI 2606
RGB object detection, Thermal object detection, Cross-modal RGBT object detection, Cross-modal contrastive learning BibRef

Yue, Y.R.[Yu-Rong], Qin, W.W.[Wei-Wei], Chi, H.[Hao], An, B.[Baiwei], Wu, D.[Dingyi], Guo, W.X.[Wen-Xin], Xiong, J.Y.[Jing-Yi],
VI-MSFFN: A Visible-Infrared Multi-Scale Feature Fusion Network for Cross-Modal Detection in Remote Sensing,
RS(18), No. 12, 2026, pp. 1938.
DOI Link 2606
BibRef

Zhang, Z.J.[Zhi-Jie], Chen, K.[Kaihong], Yang, C.[Chen], Zhang, S.[Shanwen], Wang, Z.[Zhen],
HAFM-Net: Hierarchical Alignment Fusion and Mapping for UAV-Based Misaligned RGB-T Salient Object Detection,
RS(18), No. 12, 2026, pp. 2039.
DOI Link 2606
BibRef

Weng, Q.[Qian], Zhang, Y.[Yu], Huang, X.S.[Xian-Sheng], Deng, L.M.[Li-Ming], Lin, J.[Jiawen],
DEAF-Net: Dual-Domain Enhanced Adaptive Fusion Network for UAV Visible-Infrared Object Detection,
RS(18), No. 13, 2026, pp. 2241.
DOI Link 2607
BibRef

Dong, Z.[Zeliang], Pan, J.X.[Jia-Xin], Chen, X.P.[Xiang-Peng], Zhang, W.[Wuxia], Guo, H.[Huinan],
A Wavelet-Guided Frequency-Spatial Decoupling Network for Visible-Infrared UAV Detection,
RS(18), No. 13, 2026, pp. 2121.
DOI Link 2607
BibRef

Park, C.[Chanyeong], Jang, J.[Junbo], Lee, J.[Jiyoon], Yoon, J.[Jaehong], Baek, M.[Minju], Paik, J.[Joonki],
VIDA: Unsupervised Visible-to-Infrared Domain Adaptation for Object Detection Using Large Vision Language Model,
ICIP25(1426-1431)
IEEE DOI 2601
Training, Adaptation models, Vehicle safety, Object detection, Data collection, Robustness, Data models, Infrared BibRef

Wang, H.Y.[Hao-Yu], Zhao, F.K.[Fang-Kai], Chen, F.[Fangmei], Wang, F.S.[Fa-Sheng], Sun, F.M.[Fu-Ming],
Mirror Feature-Aware Generative Adversarial Network for RGB-T Salient Object Detection,
ICIP25(1888-1893)
IEEE DOI Code:
WWW Link. 2601
Semantics, Noise, Imaging, Object detection, Generative adversarial networks, Feature extraction, Symmetric Two-stage Encoder BibRef

Zhang, C.[Ce], Wan, Z.[Zifu], Stepputtis, S.[Simon], Sycara, K.[Katia], Xie, Y.Q.[Ya-Qi],
Spectral-aware Global Fusion for RGB-Thermal Semantic Segmentation,
ICIP25(43-48)
IEEE DOI 2601
Limiting, Image color analysis, Fuses, Semantic segmentation, Refining, Lighting, Focusing, Robustness, Standards, Spectral analysis, Spectral-Aware Feature Fusion BibRef

Li, T.[Ting], Ye, M.[Mao], Wu, T.W.[Tian-Wen], Li, N.[Nianxin], Li, S.F.[Shuai-Feng], Tang, S.[Song], Ji, L.P.[Lu-Ping],
Pseudo Visible Feature Fine-Grained Fusion for Thermal Object Detection,
CVPR25(6710-6719)
IEEE DOI Code:
WWW Link. 2508
Translation, Codes, Fuses, Surveillance, Object detection, Feature extraction, Data models, Text to video, graph based fusion BibRef

Medeiros, H.R.[Heitor R.], Latortue, D.[David], Granger, E.[Eric], Pedersoli, M.[Marco],
Mixed Patch Visible-Infrared Modality Agnostic Object Detection,
WACV25(9023-9032)
IEEE DOI Code:
WWW Link. 2505
Training, Codes, Surveillance, Memory management, Object detection, Detectors, Transformers, Encoding, Mutual information, mixed patch, object detection BibRef

Guo, J.J.[Jun-Jie], Gao, C.Q.[Chen-Qiang], Liu, F.C.[Fang-Cen], Meng, D.Y.[De-Yu], Gao, X.B.[Xin-Bo],
Damsdet: Dynamic Adaptive Multispectral Detection Transformer with Competitive Query Selection and Adaptive Feature Fusion,
ECCV24(XXVII: 464-481).
Springer DOI 2412
Code:
WWW Link. BibRef

Li, X.[Xuan], Chen, R.F.[Rong-Fu], Wang, J.[Jie], Ma, L.[Lei], Cheng, L.[Li], Yuan, H.W.[Hai-Wen],
DSTCFuse: A Method based on Dual-cycled Cross-awareness of Structure Tensor for Semantic Segmentation via Infrared and Visible Image Fusion,
Crowded24(5558-5567)
IEEE DOI 2410
Degradation, Tensors, Semantic segmentation, Interference, Image fusion, Cross-modality transition, Global structure-tensor awareness BibRef

Xu, J.C.[Jia-Cong], Liao, M.Q.[Ming-Qian], Kathirvel, R.P.[Ram Prabhakar], Patel, V.M.[Vishal M.],
Leveraging Thermal Modality to Enhance Reconstruction in Low-light Conditions,
ECCV24(XXXVII: 321-339).
Springer DOI 2412
BibRef

Zhao, G.Q.[Guo-Qiang], Huang, J.J.[Jun-Jie], Yan, X.Y.[Xiao-Yun], Wang, Z.J.[Zhao-Jing], Tang, J.W.[Jun-Wei], Ou, Y.J.[Yang-Jun], Hu, X.R.[Xin-Rong], Peng, T.[Tao],
Open-Vocabulary RGB-Thermal Semantic Segmentation,
ECCV24(LXXIV: 304-320).
Springer DOI 2412
BibRef

El Ahmar, W.[Wassim], Massoud, Y.[Yahya], Kolhatkar, D.[Dhanvin], AlGhamdi, H.[Hamzah], Alja'Afreh, M.[Mohammad], Laganiere, R.[Robert], Hammoud, R.[Riad],
Enhanced Thermal-RGB Fusion for Robust Object Detection,
PBVS23(365-374)
IEEE DOI 2309
BibRef

Zhao, W.[Wenda], Xie, S.[Shigeng], Zhao, F.[Fan], He, Y.[You], Lu, H.C.[Hu-Chuan],
MetaFusion: Infrared and Visible Image Fusion via Meta-Feature Embedding from Object Detection,
CVPR23(13955-13965)
IEEE DOI 2309
BibRef

Arif, M.[Maliha], Yong, C.[Calvin], Mahalanobis, A.[Abhijit], Rahnavard, N.[Nazanin],
Background-Tolerant Object Classification With Embedded Segmentation Mask For Infrared and Color Imagery,
ICIP22(1546-1550)
IEEE DOI 2211
Training, Image segmentation, Image recognition, Shape, Image color analysis, Focusing, Data visualization, MS-COCO BibRef

Ataman, F.C.[Ferhat Can], Akar, G.B.[Güzde Bozdagi],
Visible and Infrared Image Fusion Using Encoder-Decoder Network,
ICIP21(1779-1783)
IEEE DOI 2201
Performance evaluation, Image segmentation, Convolution, Focusing, Object detection, Real-time systems, infrared, visible images, encoder-decoder network BibRef

Cheng, K.S.[Kai-Sheng], Lin, H.Y.[Huei-Yung],
Automatic target recognition by infrared and visible image matching,
MVA15(312-315)
IEEE DOI 1507
Cameras BibRef

Changrampadi, M.H.[Mohamed H.], Yun, Y.X.[Yi-Xiao], Gu, I.Y.H.[Irene Y.H.],
Multi-class ada-boost classification of object poses through visual and infrared image information fusion,
ICPR12(2865-2868).
WWW Link. 1302
BibRef

Chapter on Registration, Matching and Recognition Using Points, Lines, Regions, Areas, Surfaces continues in
Stereo and Depth Using Thermal and Visible, 3D Features, Objects .

Last update:Jul 11, 2026 at 11:55:55