8.6.4.1 Open-Vocabulary, Open-World Semantic Segmentation

Chapter Contents (Back)
Semantic Segmentation. Open-Vocabulary. Open-World.

Wang, C.[Cheng], Wang, G.[Guoli], Zhang, Q.[Qian], Guo, P.[Peng], Liu, W.Y.[Wen-Yu], Wang, X.G.[Xing-Gang],
OpenInst: A simple query-based method for open-world instance segmentation,
PR(153), 2024, pp. 110570.
Elsevier DOI Code:
WWW Link. 2405
Open-world instance segmentation, Object localization network. Query-based detector BibRef

Dao, S.D.[Son Duy], Shi, H.[Hengcan], Phung, D.[Dinh], Cai, J.F.[Jian-Fei],
Class Enhancement Losses With Pseudo Labels for Open-Vocabulary Semantic Segmentation,
MultMed(26), 2024, pp. 8442-8453.
IEEE DOI 2408
Proposals, Training, Semantic segmentation, Annotations, Semantics, Predictive models, Visualization, zero-shot semantic segmentation BibRef

Li, Z.H.[Zhi-Heng], Zhong, Y.J.[Yu-Jie], Song, R.[Ran], Li, T.J.[Tian-Jiao], Ma, L.[Lin], Zhang, W.[Wei],
DeTAL: Open-Vocabulary Temporal Action Localization With Decoupled Networks,
PAMI(46), No. 12, December 2024, pp. 7728-7741.
IEEE DOI 2411
Location awareness, Task analysis, Visualization, Proposals, Training, Adaptation models, Semantics, Open-Vocabulary, temporal action localization BibRef

Han, C.[Cong], Zhong, Y.J.[Yu-Jie], Li, D.J.[Deng-Jie], Han, K.[Kai], Ma, L.[Lin],
Open-Vocabulary Semantic Segmentation with Decoupled One-Pass Network,
ICCV23(1086-1096)
IEEE DOI Code:
WWW Link. 2401
BibRef

Zhu, C.Y.[Chao-Yang], Chen, L.[Long],
A Survey on Open-Vocabulary Detection and Segmentation: Past, Present, and Future,
PAMI(46), No. 12, December 2024, pp. 8954-8975.
IEEE DOI 2411
Survey, Open-Vocabulary. Task analysis, Visualization, Training, Semantics, Image segmentation, Vocabulary, Transfer learning, Open-vocabulary, future directions BibRef

Rai, S.N.[Shyam Nandan], Cermelli, F.[Fabio], Caputo, B.[Barbara], Masone, C.[Carlo],
Mask2Anomaly: Mask Transformer for Universal Open-Set Segmentation,
PAMI(46), No. 12, December 2024, pp. 9286-9302.
IEEE DOI 2411
Image segmentation, Task analysis, Semantic segmentation, Semantics, Transformers, Training, Noise measurement, mask architecture BibRef

Pan, T.[Ting], Tang, L.[Lulu], Wang, X.L.[Xin-Long], Shan, S.G.[Shi-Guang],
Tokenize Anything via Prompting,
ECCV24(XLVII: 330-348).
Springer DOI 2412
Code:
WWW Link. segmenting, recognizing, and captioning anything. BibRef

Yang, Y.H.[Yu-Huan], Ma, C.F.[Chao-Fan], Ju, C.[Chen], Zhang, F.[Fei], Yao, J.C.[Jiang-Chao], Zhang, Y.[Ya], Wang, Y.F.[Yan-Feng],
Multi-modal Prototypes for Open-World Semantic Segmentation,
IJCV(132), No. 12, December 2024, pp. 6004-6020.
Springer DOI 2501
BibRef

Pan, Y.[Yuwen], Sun, R.[Rui], Wang, Y.[Yuan], Yang, W.F.[Wen-Fei], Zhang, T.Z.[Tian-Zhu], Zhang, Y.D.[Yong-Dong],
Purify Then Guide: A Bi-Directional Bridge Network for Open-Vocabulary Semantic Segmentation,
CirSysVideo(35), No. 1, January 2025, pp. 343-356.
IEEE DOI 2502
Semantics, Vocabulary, Semantic segmentation, Reliability, Visualization, Proposals, Modulation, reliable attention BibRef

Xu, W.H.[Wen-Hao], Wang, C.W.[Chang-Wei], Feng, X.[Xuxiang], Xu, R.T.[Rong-Tao], Huang, L.Z.[Long-Zhao], Zhang, Z.R.[Zhe-Rui], Guo, L.[Li], Xu, S.B.[Shi-Biao],
Generalization Boosted Adapter for Open-Vocabulary Segmentation,
CirSysVideo(35), No. 1, January 2025, pp. 520-533.
IEEE DOI Code:
WWW Link. 2502
Adaptation models, Visualization, Semantics, Image segmentation, Computational modeling, Data models, Vocabulary, adapter BibRef

Shi, H.C.[Heng-Can], Dao, S.D.[Son Duy], Cai, J.F.[Jian-Fei],
LLMFormer: Large Language Model for Open-Vocabulary Semantic Segmentation,
IJCV(133), No. 2, February 2025, pp. 742-759.
Springer DOI 2502
BibRef

Wang, J.L.[Jing-Long], Li, X.[Xiawei], Zhang, J.[Jing], Xu, Q.Y.[Qing-Yuan], Zhou, Q.[Qin], Yu, Q.[Qian], Sheng, L.[Lu], Xu, D.[Dong],
Diffusion Model is Secretly a Training-Free Open Vocabulary Semantic Segmenter,
IP(34), 2025, pp. 1895-1907.
IEEE DOI 2504
Diffusion models, Semantic segmentation, Semantics, Training, Shape, Vocabulary, Data models, Noise reduction, Text to image, Data mining, semantic segmentation BibRef

Hajimiri, S.[Sina], Ayed, I.B.[Ismail Ben], Dolz, J.[Jose],
Pay Attention to Your Neighbours: Training-Free Open-Vocabulary Semantic Segmentation,
WACV25(5061-5071)
IEEE DOI Code:
WWW Link. 2505
Location awareness, Training, Visualization, Semantic segmentation, Semantics, Benchmark testing, Predictive models, Transformers, training-free BibRef

Zhou, H.[Hao], Qi, L.[Lu], Shen, T.C.[Tian-Cheng], Huang, H.[Hai], Yang, X.[Xu], Li, X.T.[Xiang-Tai], Yang, M.H.[Ming-Hsuan],
Rethinking Evaluation Metrics of Open-Vocabulary Segmentation,
PAMI(47), No. 8, August 2025, pp. 6780-6796.
IEEE DOI 2507
Measurement, Image segmentation, Semantics, Floors, Windows, Object detection, Computational modeling, Analytical models, similarity measurements BibRef

Chen, Z.[Zhen], Tang, H.[Hao], Zhang, S.L.[Shi-Liang],
Generalization-preserving adaptation of vision-language models for open-vocabulary segmentation,
CVIU(261), 2025, pp. 104518.
Elsevier DOI 2511
Generalization-preserving model adaptation, Vision-language models, Open-vocabulary segmentation BibRef

Nayal, N.[Nazir], Shoeb, Y.[Youssef], Güney, F.[Fatma],
A Likelihood Ratio-Based Approach to Segmenting Unknown Objects,
IJCV(133), No. 10, October 2025, pp. 6860-6872.
Springer DOI 2511
BibRef

Reichard, K.[Klara], Rizzoli, G.[Giulia], Gasperini, S.[Stefano], Hoyer, L.[Lukas], Zanuttigh, P.[Pietro], Navab, N.[Nassir], Tombari, F.[Federico],
From open-vocabulary to vocabulary-free semantic segmentation,
PRL(198), 2025, pp. 14-21.
Elsevier DOI Code:
WWW Link. 2511
Vocabulary-free, Semantic segmentation, Vision-language models BibRef

Wiedmann, L.[Luis], Wiehe, L.[Luca], Rozenberszki, D.[David],
DCSEG: Decoupled 3D Open-Set Segmentation using Gaussian Splatting,
OpenSUN3D25(5217-5226)
IEEE DOI 2512
Instance segmentation, Solid modeling, Semantic segmentation, Pipelines, Semantics, Predictive models, Proposals, Pattern matching, 3d scene understanding BibRef

Li, F.[Fan], Zhang, Z.X.[Zhao-Xiang], Wang, X.[Xuanbin], Wang, X.[Xuan], Xu, Y.L.[Yue-Lei],
Bridging Vision Foundation and Vision-Language Models for Open-Vocabulary Semantic Segmentation of UAV Imagery,
RS(17), No. 22, 2025, pp. 3704.
DOI Link 2512
BibRef

Huang, W.[Wubiao], Li, H.C.[Hu-Chen], Zhang, S.[Shuai], Deng, F.[Fei],
Reducing semantic ambiguity in open-vocabulary remote sensing image segmentation via knowledge graph-enhanced class representations,
PandRS(231), 2026, pp. 837-853.
Elsevier DOI Code:
WWW Link. 2512
Open-vocabulary segmentation, Semantic ambiguity, Knowledge graph, Class-aware attention BibRef

Bai, S.[Sule], Liu, Y.[Yong], Han, Y.F.[Yi-Fei], Zhang, H.J.[Hao-Ji], Tang, Y.S.[Yan-Song], Zhou, J.[Jie], Lu, J.W.[Ji-Wen],
Self-Calibrated CLIP for Training-Free Open-Vocabulary Segmentation,
IP(34), 2025, pp. 8271-8284.
IEEE DOI Code:
WWW Link. 2512
Image segmentation, Semantics, Correlation, Visualization, Noise, Feature extraction, Coherence, Spatial resolution, training-free BibRef

Zhu, W.Q.[Wen-Qi], Xie, B.[Bin], Cao, J.[Jiale], Xie, J.[Jin], Khan, F.S.[Fahad Shahbaz], Pang, Y.W.[Yan-Wei],
SED++: A Simple Encoder-Decoder for Improved Open-Vocabulary Semantic Segmentation,
PAMI(48), No. 3, March 2026, pp. 2528-2543.
IEEE DOI 2602
BibRef
Earlier: A2, A3, A4, A5, A6, Only:
SED: A Simple Encoder-Decoder for Open-Vocabulary Semantic Segmentation,
CVPR24(3426-3436)
IEEE DOI Code:
WWW Link. 2410
Semantic segmentation, Decoding, Semantics, Costs, Videos, Transformers, Accuracy, Vocabulary, Proposals, Predictive models, category early rejection. Degradation, Adaptation models, Source coding, Semantics, Open-Vocabulary, Encoder-Decoder BibRef

Chen, J.L.[Jia-Lei], Fan, Q.[Qi], Li, D.Y.[Dong-Yue], Zheng, X.[Xu], Muras, H.S.[Hiro-Shi], Deguchi, D.[Daisuke],
Training-Free Open-Vocabulary Semantic Segmentation with Context Pyramid Refinement,
IJCV(134), No. 6, June 2026, pp. 281.
Springer DOI 2605
BibRef

Chng, Y.X.[Yong Xien], Qiu, X.[Xuchong], Han, Y.Z.[Yi-Zeng], Ding, K.[Kai], Ding, W.[Wan], Huang, G.[Gao],
Aligning Vision-Language Model With Fine-Grained Semantics for Open-Vocabulary Segmentation,
CirSysVideo(36), No. 5, May 2026, pp. 7368-7381.
IEEE DOI 2605
Semantics, Visualization, Feature extraction, Training, Adaptation models, Image segmentation, Image reconstruction, vision-language model BibRef

Xu, Y.[Yuan], Jiang, L.[Lin], Wan, L.[Le], Li, Y.F.[Yun-Fei], Zhu, J.Y.[Jian-Yang], Lu, Q.[Qing],
Open world object detection applied in semantic scene construction,
PR(179), 2026, pp. 113613.
Elsevier DOI Code:
WWW Link. 2606
Object detection, Unknown environment, Scene reconstruction, Open set learning BibRef

Wang, C.W.[Chang-Wei], Xu, W.H.[Wen-Hao], Xu, R.T.[Rong-Tao], Zhang, Z.R.[Zhe-Rui], Xu, S.B.[Shi-Biao], Zhang, J.[Jiguang], Teng, X.Q.[Xiao-Qiang], Meng, W.L.[Wei-Liang], Zhang, X.P.[Xiao-Peng],
Adaptive in Adapter: Boosting Open-Vocabulary Semantic Segmentation With Adaptive Dropout Adapter,
MultMed(28), 2026, pp. 3921-3931.
IEEE DOI 2606
Semantic segmentation, Visualization, Feature extraction, Adaptation models, Artificial intelligence, Training, Pipelines, visual language model BibRef

Bohoran, T.A., Parke, K.S., Cowley, A., Gulsin, G.S., Yeo, J., Dattani, A., McCann, G.P., Giannakidis, A.,
Segmetron: Sample-efficient model-agnostic semantic segmentation with a trustworthy reject option via PQ learning,
PR(179), 2026, pp. 113753.
Elsevier DOI 2606
Covariate shift, Detection, Semantic segmentation, Hypothesis test, Arbitrary test distribution, Dataset shift, PQ learning BibRef

Singh, A.[Ashish], Jones, M.J.[Michael J.], Peng, K.C.[Kuan-Chuan], Cherian, A.[Anoop], Chatterjee, M.[Moitreya], Learned-Miller, E.[Erik],
Improving Open-World Object Localization by Discovering Background,
DomainFuture25(6440-6449)
IEEE DOI 2512
Training, Location awareness, Benchmark testing, Linear programming, Proposals, Standards, open-world detection, object detection BibRef

Zhao, Z.Y.[Zi-Yu], Li, X.G.[Xiao-Guang], Shi, L.[Linjia], Imanpour, N.[Nasrin], Wang, S.[Song],
DPSeg: Dual-Prompt Cost Volume Learning for Open-Vocabulary Semantic Segmentation,
CVPR25(25346-25356)
IEEE DOI Code:
WWW Link. 2508
Training, Visualization, Costs, Codes, Semantic segmentation, Semantics, Feature extraction, Decoding BibRef

Wang, Z.Y.[Zheng-Yang], Feng, T.L.[Ting-Liang], Lyu, F.[Fan], Shang, F.[Fanhua], Feng, W.[Wei], Wan, L.[Liang],
Dual Semantic Guidance for Open Vocabulary Semantic Segmentation,
CVPR25(20212-20222)
IEEE DOI 2508
Training, Visualization, Vocabulary, Image recognition, Text recognition, Annotations, Semantic segmentation, Semantics, Data models BibRef

Lee, M.[Minhyeok], Cho, S.[Suhwan], Lee, J.[Jungho], Yang, S.[Sunghun], Choi, H.[Heeseung], Kim, I.J.[Ig-Jae], Lee, S.Y.[Sang-Youn],
Effective SAM Combination for Open-Vocabulary Semantic Segmentation,
CVPR25(26081-26090)
IEEE DOI 2508
Accuracy, Semantic segmentation, Computational modeling, Predictive models, Robustness, Generators, Standards BibRef

Li, K.Y.[Kai-Yu], Liu, R.X.[Rui-Xun], Cao, X.[Xiangyong], Bai, X.[Xueru], Zhou, F.[Feng], Meng, D.Y.[De-Yu], Wang, Z.[Zhi],
SegEarth-OV: Towards Training-Free Open-Vocabulary Segmentation for Remote Sensing Images,
CVPR25(10545-10556)
IEEE DOI 2508
Earth, Training, Sensitivity, Shape, Semantic segmentation, Roads, Manuals, Image restoration, Remote sensing, semantic segmentation, remote sensing BibRef

Lai, Z.H.[Zi-Hang],
Exploring Simple Open-Vocabulary Semantic Segmentation,
CVPR25(30221-30230)
IEEE DOI 2508
Accuracy, Annotations, Semantic segmentation, Scalability, Semantics, Manuals, Solids, Testing BibRef

Stojnic, V.[Vladan], Kalantidis, Y.[Yannis], Matas, J.[Jirí], Tolias, G.[Giorgos],
LPOSS: Label Propagation Over Patches and Pixels for Open-vocabulary Semantic Segmentation,
CVPR25(9794-9803)
IEEE DOI Code:
WWW Link. 2508
Image resolution, Codes, Accuracy, Benchmark testing, open-vocabulary semantic segmentation, BibRef

Qorbani, R.[Reza], Villani, G.[Gianluca], Panagiotakopoulos, T.[Theodoros], Colomer, M.B.[Marc Botet], Härenstam-Nielsen, L.[Linus], Segu, M.[Mattia], Dovesi, P.L.[Pier Luigi], Karlgren, J.[Jussi], Cremers, D.[Daniel], Tombari, F.[Federico], Poggi, M.[Matteo],
Semantic Library Adaptation: LoRA Retrieval and Fusion for Open-Vocabulary Semantic Segmentation,
CVPR25(9804-9815)
IEEE DOI 2508
Training, Adaptation models, Data privacy, Vocabulary, Target tracking, Semantic segmentation, Merging, Semantics, Standards BibRef

Choi, J.[Jiho], Lee, S.[Seonho], Lee, M.[Minhyun], Lee, S.[Seungho], Shim, H.J.[Hyun-Jung],
Fine-Grained Image-Text Correspondence with Cost Aggregation for Open-Vocabulary Part Segmentation,
CVPR25(9782-9793)
IEEE DOI 2508
Image segmentation, Costs, Annotations, Object recognition, open-vocabulary part segmentation, cost aggregation, part segmentation BibRef

Kim, C.[Chanyoung], Ju, D.[Dayun], Han, W.[Woojung], Yang, M.H.[Ming-Hsuan], Hwang, S.J.[Seong Jae],
Distilling Spectral Graph for Object-Context Aware Open-Vocabulary Semantic Segmentation,
CVPR25(15033-15042)
IEEE DOI 2508
Training, Visualization, Attention mechanisms, Accuracy, Foundation models, Semantic segmentation, Semantics, Coherence, Pattern recognition BibRef

Choi, J.[Jaehyun], Ko, J.[Junwon], Lee, D.J.[Dong-Jae], Kim, J.[Junmo],
AH-OCDA: Amplitude-Based Curriculum Learning and Hopfield Segmentation Model for Open Compound Domain Adaptation,
WACV25(8280-8290)
IEEE DOI 2505
Training, Image segmentation, Adaptation models, Fast Fourier transforms, Semantic segmentation, curriculum learning BibRef

Zhuo, Y.X.[Yao-Xin], Bessinger, Z.[Zachary], Wang, L.C.[Li-Chen], Khosravan, N.[Naji], Li, B.X.[Bao-Xin], Kang, S.B.[Sing Bing],
TFM2: Training-Free Mask Matching for Open-Vocabulary Semantic Segmentation,
WACV25(4693-4703)
IEEE DOI 2505
Vocabulary, Visualization, Adaptation models, Semantic segmentation, Data models, Complexity theory BibRef

Wang, Y.M.[Yi-Mu], Czarnecki, K.[Krzysztof],
AiDe: Improving 3D Open-Vocabulary Semantic Segmentation by Aligned Vision-Language Learning,
WACV25(2674-2685)
IEEE DOI 2505
Training, Bridges, Solid modeling, Semantic segmentation, Semantics, Data collection, Benchmark testing, Data models BibRef

Kalluri, T.[Tarun], Wang, W.Y.[Wei-Yao], Wang, H.[Heng], Chandraker, M.[Manmohan], Torresani, L.[Lorenzo], Tran, D.[Du],
Open-world Instance Segmentation: Top-down Learning with Bottom-up Supervision,
L3D-IVU24(2693-2703)
IEEE DOI 2410
Instance segmentation, Degradation, Codes, Computational modeling, Taxonomy BibRef

Zheng, J.W.[Jun-Wei], Liu, R.P.[Rui-Ping], Chen, Y.F.[Yu-Fan], Peng, K.Y.[Kun-Yu], Wu, C.Z.[Cheng-Zhi], Yang, K.L.[Kai-Lun], Zhang, J.M.[Jia-Ming], Stiefelhagen, R.[Rainer],
Open Panoramic Segmentation,
ECCV24(XXXIX: 164-182).
Springer DOI 2412
BibRef

Karazija, L.[Laurynas], Laina, I.[Iro], Vedaldi, A.[Andrea], Rupprecht, C.[Christian],
Diffusion Models for Open-vocabulary Segmentation,
ECCV24(V: 299-317).
Springer DOI 2412
BibRef

Wilms, C.[Christian], Rolff, T.[Tim], Hillemann, M.[Maris], Johanson, R.[Robert], Frintrop, S.[Simone],
Sos: Segment Object System for Open-world Instance Segmentation with Object Priors,
ECCV24(XXVII: 165-182).
Springer DOI 2412
BibRef

Jiao, S.[Siyu], Zhu, H.G.[Hong-Guang], Huang, J.N.[Jian-Nan], Zhao, Y.[Yao], Wei, Y.C.[Yun-Chao], Shi, H.[Humphrey],
Collaborative Vision-text Representation Optimizing for Open-vocabulary Segmentation,
ECCV24(XXXIII: 399-416).
Springer DOI 2412
BibRef

Wysoczanska, M.[Monika], Siméoni, O.[Oriane], Ramamonjisoa, M.[Michaël], Bursuc, A.[Andrei], Trzcinski, T.[Tomasz], Pérez, P.[Patrick],
CLIP-dinoiser: Teaching CLIP a Few Dino Tricks for Open-vocabulary Semantic Segmentation,
ECCV24(LXI: 320-337).
Springer DOI 2412
BibRef

Shao, T.[Tong], Tian, Z.[Zhuotao], Zhao, H.[Hang], Su, J.[Jingyong],
Explore the Potential of CLIP for Training-free Open Vocabulary Semantic Segmentation,
ECCV24(LXXXVI: 139-156).
Springer DOI 2412
BibRef

Lan, M.C.[Meng-Cheng], Chen, C.F.[Chao-Feng], Ke, Y.P.[Yi-Ping], Wang, X.J.[Xin-Jiang], Feng, L.[Litong], Zhang, W.[Wayne],
Proxyclip: Proxy Attention Improves CLIP for Open-vocabulary Segmentation,
ECCV24(LXVIII: 70-88).
Springer DOI 2412
BibRef

Jiang, L.[Li], Shi, S.S.[Shao-Shuai], Schiele, B.[Bernt],
Open-Vocabulary 3D Semantic Segmentation with Foundation Models,
CVPR24(21284-21294)
IEEE DOI 2410
Text recognition, Semantic segmentation, 3D Semantic Segmentation, Open Vocabulary, Foundation Models BibRef

Zhao, W.J.[Wen-Jie], Li, J.[Jia], Dong, X.[Xin], Xiang, Y.[Yu], Guo, Y.H.[Yun-Hui],
Segment Every Out-of-Distribution Object,
CVPR24(3910-3920)
IEEE DOI Code:
WWW Link. 2410
Codes, Semantic segmentation, Face recognition, Benchmark testing, Out-of-distribution detection, Semantic segmentation, prompt-based segmentation BibRef

Liu, Y.[Yong], Bai, S.[Sule], Li, G.B.[Guan-Bin], Wang, Y.T.[Yi-Tong], Tang, Y.S.[Yan-Song],
Open-Vocabulary Segmentation with Semantic-Assisted Calibration,
CVPR24(3491-3500)
IEEE DOI 2410
Measurement, Image segmentation, Visualization, Semantics, Benchmark testing, Predictive models, open-vocabulary segmentation BibRef

Bousselham, W.[Walid], Petersen, F.[Felix], Ferrari, V.[Vittorio], Kuehne, H.[Hilde],
Grounding Everything: Emerging Localization Properties in Vision-Language Transformers,
CVPR24(3828-3837)
IEEE DOI Code:
WWW Link. 2410
Location awareness, Training, Codes, Grounding, Semantic segmentation, Pipelines, open-vocabulary zero-shot, CLIP BibRef

Wang, Y.[Yuan], Sun, R.[Rui], Luo, N.[Naisong], Pan, Y.[Yuwen], Zhang, T.Z.[Tian-Zhu],
Image-to-Image Matching via Foundation Models: A New Perspective for Open-Vocabulary Semantic Segmentation,
CVPR24(3952-3963)
IEEE DOI 2410
Visualization, Image recognition, Semantic segmentation, Benchmark testing, Lead, Diffusion models, Training-free BibRef

Nguyen, P.[Phuc], Ngo, T.D.[Tuan Duc], Kalogerakis, E.[Evangelos], Gan, C.[Chuang], Tran, A.[Anh], Pham, C.[Cuong], Nguyen, K.[Khoi],
Open3DIS: Open-Vocabulary 3D Instance Segmentation with 2D Mask Guidance,
CVPR24(4018-4028)
IEEE DOI 2410
Instance segmentation, Point cloud compression, Location awareness, Shape, Performance gain, 3D Instance Segmentation BibRef

Luo, J.Y.[Jia-Yun], Khandelwal, S.[Siddhesh], Sigal, L.[Leonid], Li, B.Y.[Bo-Yang],
Emergent Open-Vocabulary Semantic Segmentation from Off-the-Shelf Vision-Language Models,
CVPR24(4029-4040)
IEEE DOI Code:
WWW Link. 2410
Training, Vocabulary, Visualization, Image resolution, Semantic segmentation, Text to image, training-free BibRef

Bourouis, A.[Ahmed], Fan, J.E.[Judith E.], Gryaditskaya, Y.[Yulia],
Open Vocabulary Semantic Scene Sketch Understanding,
CVPR24(4176-4186)
IEEE DOI 2410
Training, Vocabulary, Visualization, Semantics, Pipelines, Psychology BibRef

Wang, X.Q.[Xiao-Qi], He, W.B.[Wen-Bin], Xuan, X.[Xiwei], Sebastian, C.[Clint], Ono, J.P.[Jorge Piazentin], Li, X.[Xin], Behpour, S.[Sima], Doan, T.[Thang], Gou, L.[Liang], Shen, H.W.[Han-Wei], Ren, L.[Liu],
USE: Universal Segment Embeddings for Open-Vocabulary Image Segmentation,
CVPR24(4187-4196)
IEEE DOI 2410
Representation learning, Image segmentation, Vocabulary, Semantic segmentation, Scalability, Pipelines, foundation model BibRef

Marcos-Manchon, P.[Pablo], Alcover-Couso, R.[Roberto], SanMiguel, J.C.[Juan C.], Martinez, J.M.[Jose M.],
Open-Vocabulary Attention Maps with Token Optimization for Semantic Segmentation in Diffusion Models,
CVPR24(9242-9252)
IEEE DOI 2410
Training, Vocabulary, Text recognition, Semantic segmentation, Computational modeling, Text to image, Diffusion models, Attention BibRef

Sun, S.Y.[Shu-Yang], Li, R.[Runjia], Torr, P.[Philip], Gu, X.[Xiuye], Li, S.Y.[Si-Yang],
CLIP as RNN: Segment Countless Visual Concepts without Training Endeavor,
CVPR24(13171-13182)
IEEE DOI 2410
Training, Vocabulary, Visualization, Filters, Semantic segmentation, Semantics, open-vocabulary, image segmentation, training-free methods BibRef

Kong, L.D.[Ling-Dong], Liu, Y.Q.[You-Quan], Ng, L.X.[Lai Xing], Cottereau, B.R.[Benoit R.], Ooi, W.T.[Wei Tsang],
OpenESS: Event-Based Semantic Scene Understanding with Open Vocabularies,
CVPR24(15686-15698)
IEEE DOI 2410
Representation learning, Vocabulary, Image resolution, Semantic segmentation, Scalability, Semantics, Event Camera, Multi-Modal Learning BibRef

Xu, J.X.[Jing-Xuan], Chen, W.Y.[Wu-Yang], Zhao, Y.[Yao], Wei, Y.C.[Yun-Chao],
Transferable and Principled Efficiency for Open-Vocabulary Segmentation,
CVPR24(15814-15824)
IEEE DOI Code:
WWW Link. 2410
Training, Convolutional codes, Costs, Computational modeling, Object detection, Solids BibRef

Barsellotti, L.[Luca], Amoroso, R.[Roberto], Cornia, M.[Marcella], Baraldi, L.[Lorenzo], Cucchiara, R.[Rita],
Training-Free Open-Vocabulary Segmentation with Offline Diffusion-Augmented Prototype Generation,
CVPR24(3689-3698)
IEEE DOI 2410
Training, Location awareness, Visualization, Semantic segmentation, Source coding, Semantics, Open-Vocabulary, Segmentation, Unsupervised BibRef

Choe, S.A.[Seun-An], Shin, A.H.[Ah-Hyung], Park, K.H.[Keon-Hee], Choi, J.[Jinwoo], Park, G.M.[Gyeong-Moon],
Open-Set Domain Adaptation for Semantic Segmentation,
CVPR24(23943-23953)
IEEE DOI Code:
WWW Link. 2410
Industries, Adaptation models, Limiting, Shape, Semantic segmentation, Computational modeling, Domain Adaptation BibRef

Shan, X.H.[Xiang-Heng], Wu, D.Y.[Dong-Yue], Zhu, G.L.[Gui-Lin], Shao, Y.J.[Yuan-Jie], Sang, N.[Nong], Gao, C.X.[Chang-Xin],
Open-Vocabulary Semantic Segmentation with Image Embedding Balancing,
CVPR24(28412-28421)
IEEE DOI Code:
WWW Link. 2410
Training, Adaptation models, Vocabulary, Image resolution, Image recognition, Semantic segmentation, Semantics BibRef

Li, Z.[Ziyi], Zhou, Q.[Qinye], Zhang, X.Y.[Xiao-Yun], Zhang, Y.[Ya], Wang, Y.F.[Yan-Feng], Xie, W.[Weidi],
Open-vocabulary Object Segmentation with Diffusion Models,
ICCV23(7633-7642)
IEEE DOI 2401
BibRef

Zhu, M.[Muzhi], Li, H.T.[Heng-Tao], Chen, H.[Hao], Fan, C.X.[Cheng-Xiang], Mao, W.[Weian], Jing, C.C.[Chen-Chen], Liu, Y.F.[Yi-Fan], Shen, C.H.[Chun-Hua],
SegPrompt: Boosting Open-world Segmentation via Category-level Prompt Learning,
ICCV23(999-1008)
IEEE DOI Code:
WWW Link. 2401
BibRef

Zhang, H.[Hao], Li, F.[Feng], Zou, X.[Xueyan], Liu, S.L.[Shi-Long], Li, C.Y.[Chun-Yuan], Yang, J.W.[Jian-Wei], Zhang, L.[Lei],
A Simple Framework for Open-Vocabulary Segmentation and Detection,
ICCV23(1020-1031)
IEEE DOI Code:
WWW Link. 2401
BibRef

Huang, K.[Kai], Wang, F.[Feigege], Xi, Y.[Ye], Gao, Y.T.[Yu-Tao],
Prototypical Kernel Learning and Open-set Foreground Perception for Generalized Few-shot Semantic Segmentation,
ICCV23(19199-19208)
IEEE DOI 2401
BibRef

Cai, K.X.[Kai-Xin], Ren, P.Z.[Peng-Zhen], Zhu, Y.[Yi], Xu, H.[Hang], Liu, J.Z.[Jian-Zhuang], Li, C.L.[Chang-Lin], Wang, G.R.[Guang-Run], Liang, X.D.[Xiao-Dan],
MixReorg: Cross-Modal Mixed Patch Reorganization is a Good Mask Learner for Open-World Semantic Segmentation,
ICCV23(1196-1205)
IEEE DOI 2401
BibRef

Chen, J.[Jun], Zhu, D.[Deyao], Qian, G.C.[Guo-Cheng], Ghanem, B.[Bernard], Yan, Z.C.[Zhi-Cheng], Zhu, C.C.[Chen-Chen], Xiao, F.Y.[Fan-Yi], Culatana, S.C.[Sean Chang], Elhoseiny, M.[Mohamed],
Exploring Open-Vocabulary Semantic Segmentation from CLIP Vision Encoder Distillation Only,
ICCV23(699-710)
IEEE DOI Code:
WWW Link. 2401
BibRef

Han, K.Y.[Kun-Yang], Liu, Y.[Yong], Liew, J.H.[Jun Hao], Ding, H.H.[Heng-Hui], Liu, J.J.[Jia-Jun], Wang, Y.T.[Yi-Tong], Tang, Y.S.[Yan-Song], Yang, Y.[Yujiu], Feng, J.S.[Jia-Shi], Zhao, Y.[Yao], Wei, Y.C.[Yun-Chao],
Global Knowledge Calibration for Fast Open-Vocabulary Segmentation,
ICCV23(797-807)
IEEE DOI 2401
BibRef

Barsellotti, L.[Luca], Amoroso, R.[Roberto], Baraldi, L.[Lorenzo], Cucchiara, R.[Rita],
FOSSIL: Free Open-Vocabulary Semantic Segmentation through Synthetic References Retrieval,
WACV24(1453-1462)
IEEE DOI 2404
BibRef
Earlier:
Enhancing Open-vocabulary Semantic Segmentation with Prototype Retrieval,
CIAP23(II:196-208).
Springer DOI 2312
Training, Visualization, Sensitivity, Semantic segmentation, Semantics, Prototypes, Predictive models, Algorithms, Image recognition and understanding BibRef

Xu, J.[Jilan], Hou, J.L.[Jun-Lin], Zhang, Y.J.[Yue-Jie], Feng, R.[Rui], Wang, Y.[Yi], Qiao, Y.[Yu], Xie, W.[Weidi],
Learning Open-Vocabulary Semantic Segmentation Models From Natural Language Supervision,
CVPR23(2935-2944)
IEEE DOI 2309
BibRef

Cha, J.[Junbum], Mun, J.[Jonghwan], Roh, B.[Byungseok],
Learning to Generate Text-Grounded Mask for Open-World Semantic Segmentation from Only Image-Text Pairs,
CVPR23(11165-11174)
IEEE DOI 2309
BibRef

Mukhoti, J.[Jishnu], Lin, T.Y.[Tsung-Yu], Poursaeed, O.[Omid], Wang, R.[Rui], Shah, A.[Ashish], Torr, P.H.S.[Philip H.S.], Lim, S.N.[Ser-Nam],
Open Vocabulary Semantic Segmentation with Patch Aligned Contrastive Learning,
CVPR23(19413-19423)
IEEE DOI 2309
BibRef

Liang, F.[Feng], Wu, B.[Bichen], Dai, X.L.[Xiao-Liang], Li, K.P.[Kun-Peng], Zhao, Y.[Yinan], Zhang, H.[Hang], Zhang, P.Z.[Pei-Zhao], Vajda, P.[Peter], Marculescu, D.[Diana],
Open-Vocabulary Semantic Segmentation with Mask-adapted CLIP,
CVPR23(7061-7070)
IEEE DOI 2309
BibRef

Zabari, N.[Nir], Hoshen, Y.[Yedid],
Open-vocabulary Semantic Segmentation Using Test-time Distillation,
LLID22(56-72).
Springer DOI 2304
BibRef

Nunes, I.[Ian], Pereira, M.B.[Matheus B.], Oliveira, H.[Hugo], dos Santos, J.A.[Jefersson A.], Poggi, M.[Marcus],
Conditional Reconstruction for Open-Set Semantic Segmentation,
ICIP22(946-950)
IEEE DOI 2211
Adaptation models, Semantics, Time series analysis, Data integration, Decoding, Task analysis, Image reconstruction, open world BibRef

Liu, Q.D.[Quan-De], Wen, Y.P.[You-Peng], Han, J.H.[Jian-Hua], Xu, C.J.[Chun-Jing], Xu, H.[Hang], Liang, X.D.[Xiao-Dan],
Open-World Semantic Segmentation via Contrasting and Clustering Vision-Language Embedding,
ECCV22(XX:275-292).
Springer DOI 2211
BibRef

Chapter on 2-D Region Segmentation Techniques, Snakes, Active Contours continues in
Vision Transformers for Semantic Segmentation .

Last update:Jul 11, 2026 at 11:55:55