26.1.7.2 Audio Source Separation, Source Localization, Direction of Arrival, DoA, Analysis

Chapter Contents (Back)
Audio. Source Separation. Localization. Source Localization. Direction of Arrival. DoA.

Aarabi, P.,
Self-localizing dynamic microphone arrays,
SMC-C(32), No. 4, November 2002, pp. 474-484.
IEEE Top Reference. 0301
BibRef

Aarabi, P.,
Localization-Based Sensor Validation Using the Kullback-Leibler Divergence,
SMC-B(34), No. 2, April 2004, pp. 1007-1016.
IEEE Abstract. 0404
BibRef

Le Roux, J., Vincent, E.,
Consistent Wiener Filtering for Audio Source Separation,
SPLetters(20), No. 3, March 2013, pp. 217-220.
IEEE DOI 1303
BibRef

Kowalczyk, K., Habets, E.A.P., Kellermann, W., Naylor, P.A.,
Blind System Identification Using Sparse Learning for TDOA Estimation of Room Reflections,
SPLetters(20), No. 7, 2013, pp. 653-656.
IEEE DOI 1307
acoustic signal processing; blind source separation BibRef

Jiang, K., Wu, C., Guo, Y., Fu, Q., Yan, Y.,
Acoustic Echo Control with Frequency-Domain Stage-Wise Regression,
SPLetters(21), No. 10, October 2014, pp. 1265-1269.
IEEE DOI 1407
Acoustics BibRef

Arberet, S., Vandergheynst, P.,
Reverberant Audio Source Separation via Sparse and Low-Rank Modeling,
SPLetters(21), No. 4, April 2014, pp. 404-408.
IEEE DOI 1403
audio signal processing BibRef

Vincent, E., Bertin, N., Gribonval, R., Bimbot, F.,
From Blind to Guided Audio Source Separation: How models and side information can improve the separation of sound,
SPMag(31), No. 3, May 2014, pp. 107-115.
IEEE DOI 1405
Audio systems BibRef

Ewert, S., Pardo, B., Mueller, M., Plumbley, M.,
Score-Informed Source Separation for Musical Audio Recordings: An overview,
SPMag(31), No. 3, May 2014, pp. 116-124.
IEEE DOI 1405
Audio recording BibRef

Barnard, M., Koniusz, P., Wang, W.W.[Wen-Wu], Kittler, J.V.[Josef V.], Naqvi, S.M., Chambers, J.,
Robust Multi-Speaker Tracking via Dictionary Learning and Identity Modeling,
MultMed(16), No. 3, April 2014, pp. 864-880.
IEEE DOI 1405
direction-of-arrival estimation BibRef

Kilic, V., Barnard, M., Wang, W.W.[Wen-Wu], Kittler, J.V.[Josef V.],
Audio Assisted Robust Visual Tracking With Adaptive Particle Filtering,
MultMed(17), No. 2, February 2015, pp. 186-200.
IEEE DOI 1502
Gaussian noise BibRef

Lima, M.V.S., Martins, W.A., Nunes, L.O., Biscainho, L.W.P., Ferreira, T.N., Costa, M.V.M., Lee, B.[Bowon],
A Volumetric SRP with Refinement Step for Sound Source Localization,
SPLetters(22), No. 8, August 2015, pp. 1098-1102.
IEEE DOI 1502
computational complexity BibRef

Yook, D., Lee, T., Cho, Y.,
Fast Sound Source Localization Using Two-Level Search Space Clustering,
Cyber(46), No. 1, January 2016, pp. 20-26.
IEEE DOI 1601
Accuracy BibRef

Kugler, M.[Mauricio], Tossavainen, T.[Teemu], Kuroyanagi, S.[Susumu], Iwata, A.[Akira],
Design of a Compact Sound Localization Device on a Stand-Alone FPGA-Based Platform,
IEICE(E99-D), No. 11, November 2016, pp. 2682-2693.
WWW Link. 1611
BibRef

Salvati, D.[Daniele], Drioli, C.[Carlo], Foresti, G.L.[Gian Luca],
A weighted MVDR beamformer based on SVM learning for sound source localization,
PRL(84), No. 1, 2016, pp. 15-21.
Elsevier DOI 1612
Sound source localization BibRef

Yu, K., Hudson, R.E., Zhang, Y.D., Yao, K., Taylor, C., Wang, Z.,
Low-Complexity 2D Direction-of-Arrival Estimation for Acoustic Sensor Arrays,
SPLetters(23), No. 12, December 2016, pp. 1791-1795.
IEEE DOI 1612
direction-of-arrival estimation BibRef

Chan, T.S.T., Yang, Y.H.[Yi-Hsuan],
Complex and Quaternionic Principal Component Pursuit and Its Application to Audio Separation,
SPLetters(23), No. 2, February 2016, pp. 287-291.
IEEE DOI 1602
audio signal processing BibRef

Choi, J., Kim, J., Kim, N.S.,
Robust Time-Delay Estimation for Acoustic Indoor Localization in Reverberant Environments,
SPLetters(24), No. 2, February 2017, pp. 226-230.
IEEE DOI 1702
acoustic signal processing BibRef

Cobos, M., García-Pineda, M., Arevalillo-Herráez, M.,
Steered Response Power Localization of Acoustic Passband Signals,
SPLetters(24), No. 5, May 2017, pp. 717-721.
IEEE DOI 1704
Acoustics BibRef

Evers, C., Habets, E.A.P., Gannot, S., Naylor, P.A.,
DoA Reliability for Distributed Acoustic Tracking,
SPLetters(25), No. 9, September 2018, pp. 1320-1324.
IEEE DOI 1809
acoustic communication (telecommunication), direction-of-arrival estimation, wireless sensor networks, smart homes BibRef

Fourer, D., Auger, F., Peeters, G.,
Local AM/FM Parameters Estimation: Application to Sinusoidal Modeling and Blind Audio Source Separation,
SPLetters(25), No. 10, October 2018, pp. 1600-1604.
IEEE DOI 1810
amplitude modulation, audio signal processing, blind source separation, frequency estimation, time-frequency analysis BibRef

Chen, Y., Wang, W., Wang, Z., Xia, B.,
A Source Counting Method Using Acoustic Vector Sensor Based on Sparse Modeling of DOA Histogram,
SPLetters(26), No. 1, January 2019, pp. 69-73.
IEEE DOI 1901
acoustic signal processing, array signal processing, blind source separation, direction-of-arrival estimation, OMP BibRef

Karamatli, E., Cemgil, A.T., Kirbiz, S.,
Audio Source Separation Using Variational Autoencoders and Weak Class Supervision,
SPLetters(26), No. 9, September 2019, pp. 1349-1353.
IEEE DOI 1909
audio signal processing, neural nets, source separation, weak class supervision, source separation method, Variational Autoencoders BibRef

Magron, P., Virtanen, T.,
Online Spectrogram Inversion for Low-Latency Audio Source Separation,
SPLetters(27), 2020, pp. 306-310.
IEEE DOI 2003
Audio source separation, low-latency, online spectrogram inversion, phase recovery, sinusoidal modeling BibRef

Pezzoli, M., Carabias-Orti, J.J., Cobos, M., Antonacci, F., Sarti, A.,
Ray-Space-Based Multichannel Nonnegative Matrix Factorization for Audio Source Separation,
SPLetters(28), 2021, pp. 369-373.
IEEE DOI 2102
Microphones, Time-frequency analysis, Transmission line matrix methods, Arrays, Microphone arrays, array signal processing BibRef

Chen, J.H.[Jin-Hui], Takashima, R.[Ryoichi], Guo, X.C.[Xing-Chen], Zhang, Z.H.[Zhi-Hong], Xu, X.X.[Xue-Xin], Takiguchi, T.[Tetsuya], Hancock, E.R.[Edwin R.],
Multimodal fusion for indoor sound source localization,
PR(115), 2021, pp. 107906.
Elsevier DOI 2104
Sound source localization, Acoustic transfer function, HMM, Polar HOG, SVM BibRef

Cheng, G., Liao, L., Chen, H., Lu, J.,
Semi-Blind Source Separation for Nonlinear Acoustic Echo Cancellation,
SPLetters(28), 2021, pp. 474-478.
IEEE DOI 2103
Numerical models, Adaptation models, Signal processing algorithms, Adaptive filters, Echo cancellers, semi-blind source separation BibRef

Lu, D.[Da], Duan, R.[Rui], Yang, K.[Kunde],
Closed-Form Hybrid Cramer-Rao Bound for DOA Estimation by an Acoustic Vector Sensor Under Orientation Deviation,
SPLetters(28), 2021, pp. 2033-2037.
IEEE DOI 2111
Estimation, Direction-of-arrival estimation, Acoustics, Cramer-Rao bounds, Acoustic measurements, Data models, orientation deviation BibRef

Li, W.[Wei], Schotland, J.C.[John C.], Yang, Y.[Yang], Zhong, Y.M.[Yi-Min],
An Acousto-electric Inverse Source Problem,
SIIMS(14), No. 4, 2021, pp. 1601-1616.
DOI Link 2112
BibRef

Sedighi, S.[Saeid], Shankar, M.R.B.[M. R. Bhavani], Soltanalian, M.[Mojtaba], Ottersten, B.[Björn],
DoA Estimation Using Low-Resolution Multi-Bit Sparse Array Measurements,
SPLetters(28), 2021, pp. 1400-1404.
IEEE DOI 2108
Direction-of-arrival estimation, Estimation, Covariance matrices, Optimization, Quantization (signal), Sparse matrices, Simulation, few-bit quantization BibRef

Qian, X.Y.[Xin-Yuan], Zhang, Q.[Qiquan], Guan, G.H.[Guo-Hui], Xue, W.[Wei],
Deep Audio-Visual Beamforming for Speaker Localization,
SPLetters(29), 2022, pp. 1132-1136.
IEEE DOI 2205
Microphones, Location awareness, Correlation, Array signal processing, Visualization, Feature extraction, variational auto-encoder BibRef

Xiang, X.X.[Xiao-Xiao], Zhang, X.J.[Xiao-Juan], Xie, W.[Wupeng],
Distributed Microphones Speech Separation by Learning Spatial Information With Recurrent Neural Network,
SPLetters(29), 2022, pp. 1541-1545.
IEEE DOI 2208
Task analysis, Convolution, Speech enhancement, Training, Noise measurement, Recurrent neural networks, Decoding, time-domain BibRef

Qu, X.H.[Xing-Hao], Lou, Y.[Yi], Zhao, Y.J.[Yun-Jiang], Lu, Y.H.[Yin-Heng], Qiao, G.[Gang],
Augmented Tensor MUSIC for DOA Estimation Using Nested Acoustic Vector-Sensor Array,
SPLetters(29), 2022, pp. 1624-1628.
IEEE DOI 2208
Tensors, Sensor arrays, Estimation, Correlation, Direction-of-arrival estimation, Apertures, Acoustic arrays, tensor modeling BibRef

Zhou, L.[Lang], Ye, K.[Kun], Qi, J.[Jie], Sun, H.X.[Hai-Xin],
DOA Estimation Based on Pseudo-Noise Subspace for Relocating Enhanced Nested Array,
SPLetters(29), 2022, pp. 1858-1862.
IEEE DOI 2209
Direction-of-arrival estimation, Sensor arrays, Estimation, Sensors, Signal processing algorithms, Array signal processing, relocating enhanced nested array BibRef

Sprunck, T.[Tom], Deleforge, A.[Antoine], Privat, Y.[Yannick], Foy, C.[Cédric],
Gridless 3D Recovery of Image Sources From Room Impulse Responses,
SPLetters(29), 2022, pp. 2427-2431.
IEEE DOI 2212
Inverse problems, Array signal processing, Propagation, Superresolution, Radon, Signal processing algorithms, convex optimization BibRef

Wang, R.[Ran], Yi, X.Q.[Xiao-Quan], Yu, L.[Liang], Zhang, C.Y.[Chen-Yu], Wang, T.D.[Tong-Dong], Zhang, X.P.[Xiao-Peng],
Infrasound Source Localization of Distributed Stations Using Sparse Bayesian Learning and Bayesian Information Fusion,
RS(14), No. 13, 2022, pp. xx-yy.
DOI Link 2208
BibRef

Salvati, D.[Daniele], Drioli, C.[Carlo], Foresti, G.L.[Gian Luca],
Acoustic Source Localization Using a Geometrically Sampled Grid SRP-PHAT Algorithm With Max-Pooling Operation,
SPLetters(29), 2022, pp. 1828-1832.
IEEE DOI 2209
Location awareness, Reverberation, Mathematical models, Spatial resolution, Signal processing algorithms, Phased arrays, steered response power BibRef

Guo, X.C.[Xing-Chen], Xu, X.X.[Xue-Xin], Chen, X.Q.[Xun-Quan], Chen, J.H.[Jin-Hui], Jia, R.[Rong], Zhang, Z.H.[Zhi-Hong], Takiguchi, T.[Tetsuya], Hancock, E.R.[Edwin R.],
Direction of arrival estimation for indoor environments based on acoustic composition model with a single microphone,
PR(129), 2022, pp. 108715.
Elsevier DOI 2206
Gaussian mixture model (GMM), Acoustic transfer function (ATF), Talker localization BibRef

Arriaga-Trejo, I.A.[Israel A.], Orozco-Lugo, A.G.[Aldo G.], He, J.[Jin], Shu, T.[Ting], Truong, T.K.[Trieu-Kien],
Azimuth-Elevation Direction Finding With a Pair of Acoustic Vector Sensors in the Presence of a Reflecting Boundary,
SPLetters(29), 2022, pp. 2138-2142.
IEEE DOI 2211
Sensors, Signal processing algorithms, Acoustics, Transmission line matrix methods, Tensors, Matrix decomposition, fourth-order cumulant BibRef

Lee, S.[Seungjun], Yang, H.[Haesang], Choi, H.[Hwiyong], Seong, W.[Woojae],
Zero-Shot Single-Microphone Sound Classification and Localization in a Building Via the Synthesis of Unseen Features,
MultMed(24), 2022, pp. 2339-2351.
IEEE DOI 2205
Location awareness, Microphones, Buildings, Feature extraction, Training, Reverberation, Data models, zero-shot learning BibRef

Lin, Y.B.[Yan-Bo], Tseng, H.Y.[Hung-Yu], Lee, H.Y.[Hsin-Ying], Lin, Y.Y.[Yen-Yu], Yang, M.H.[Ming-Hsuan],
Unsupervised sound localization via iterative contrastive learning,
CVIU(227), 2023, pp. 103602.
Elsevier DOI 2301
Sound localization, Unsupervised Learning, Contrastive learning BibRef

Silber, E.A.[Elizabeth A.], Bowman, D.C.[Daniel C.], Giannone, M.R.[Miro Ronac],
Detection of the Large Surface Explosion Coupling Experiment by a Sparse Network of Balloon-Borne Infrasound Sensors,
RS(15), No. 2, 2023, pp. xx-yy.
DOI Link 2301
BibRef

Luo, Z.Q.[Zhong-Qiang],
Independent vector analysis: Model, applications, challenges,
PR(138), 2023, pp. 109376.
Elsevier DOI 2303
IVA, BSS, ICA, Source priori models, Unsupervised learning, Audio source separation BibRef

Yang, Y.[Yi], Hu, Q.[Qi], Zhao, Q.W.[Qing-Wei], Zhang, P.Y.[Peng-Yuan],
So-DAS: A Two-Step Soft-Direction-Aware Speech Separation Framework,
SPLetters(30), 2023, pp. 344-348.
IEEE DOI 2305
Direction-of-arrival estimation, Particle separators, Training data, Training, Signal to noise ratio, Reflection, deep learning BibRef

Luo, X.Q.[Xue-Qin], Jin, J.[Jilu], Huang, G.P.[Gong-Ping], Chen, J.D.[Jing-Dong], Benesty, J.[Jacob],
Design of Steerable Linear Differential Microphone Arrays With Omnidirectional and Bidirectional Sensors,
SPLetters(30), 2023, pp. 463-467.
IEEE DOI 2305
Microphone arrays, Sensors, Sensor arrays, Array signal processing, Jacobian matrices, White noise, Image color analysis, directivity factor BibRef

Chu, N.[Ning], Hu, K.Y.[Ke-Yu], Yu, L.[Liang], Mohammad-Djafari, A.[Ali], Yang, W.H.[Wei-Hua],
High-Resolution Fast-Rotating Sound Localization Based on Modal Composition Beamforming and Bayesian Inversion,
SPLetters(30), 2023, pp. 349-353.
IEEE DOI 2305
Array signal processing, Bayes methods, Location awareness, Frequency-domain analysis, Time-domain analysis, TV, subspace variational bayesian method BibRef

Zhang, Z.[Zhe], Wen, F.Q.[Fang-Qing], Shi, J.P.[Jun-Peng], He, J.[Jin], Truong, T.K.[Trieu-Kien],
2D-DOA Estimation for Coherent Signals via a Polarized Uniform Rectangular Array,
SPLetters(30), 2023, pp. 893-897.
IEEE DOI 2308
Sensor arrays, Estimation, Matrix decomposition, Transmission line matrix methods, Sensors, Smoothing methods, parallel factor analysis BibRef

Bando, Y.[Yoshiaki], Sekiguchi, K.[Kouhei], Masuyama, Y.[Yoshiki], Nugraha, A.A.[Aditya Arie], Fontaine, M.[Mathieu], Yoshii, K.[Kazuyoshi],
Neural Full-Rank Spatial Covariance Analysis for Blind Source Separation,
SPLetters(28), 2021, pp. 1670-1674.
IEEE DOI 2109
Training, Predictive models, Decoding, Reverberation, Neural networks, Computational modeling, Analytical models, variational autoencoders BibRef

Munakata, H.[Hokuto], Bando, Y.[Yoshiaki], Takeda, R.[Ryu], Komatani, K.[Kazunori], Onishi, M.[Masaki],
Joint Separation and Localization of Moving Sound Sources Based on Neural Full-Rank Spatial Covariance Analysis,
SPLetters(30), 2023, pp. 384-388.
IEEE DOI 2305
Location awareness, Blind source separation, Training, Predictive models, Neural networks, Standards, Geometry, source separation and localization BibRef

Zhu, G.[Ge], Darefsky, J.[Jordan], Jiang, F.[Fei], Selitskiy, A.[Anton], Duan, Z.Y.[Zhi-Yao],
Music Source Separation With Generative Flow,
SPLetters(29), 2022, pp. 2288-2292.
IEEE DOI 2212
Source separation, Training, Spectrogram, Generators, Task analysis, Optimization, Multiple signal classification, music source separation BibRef

Hu, D.[De], Chen, Z.[Zhe], Yin, F.[Fuliang],
Acoustic SLAM With Moving Sound Event Based on Auxiliary Microphone Arrays,
ITS(24), No. 11, November 2023, pp. 11823-11834.
IEEE DOI 2311
BibRef

Yun, H.[Heeseung], Na, J.[Joonil], Kim, G.[Gunhee],
Dense 2D-3D Indoor Prediction with Sound via Aligned Cross-Modal Distillation,
ICCV23(7829-7838)
IEEE DOI 2401
BibRef

Chen, Z.Y.[Zi-Yang], Qian, S.[Shengyi], Owens, A.[Andrew],
Sound Localization from Motion: Jointly Learning Sound Direction and Camera Rotation,
ICCV23(7863-7874)
IEEE DOI Code:
WWW Link. 2401
BibRef

Senocak, A.[Arda], Ryu, H.[Hyeonggon], Kim, J.[Junsik], Oh, T.H.[Tae-Hyun], Pfister, H.[Hanspeter], Chung, J.S.[Joon Son],
Sound Source Localization is All about Cross-Modal Alignment,
ICCV23(7743-7753)
IEEE DOI 2401
BibRef

Ryan, F.[Fiona], Jiang, H.[Hao], Shukla, A.[Abhinav], Rehg, J.M.[James M.], Ithapu, V.K.[Vamsi Krishna],
Egocentric Auditory Attention Localization in Conversations,
CVPR23(14663-14674)
IEEE DOI 2309
BibRef

Chen, J.[Jiaben], Zhang, R.[Renrui], Lian, D.Z.[Dong-Ze], Yang, J.Q.[Jia-Qi], Zeng, Z.[Ziyao], Shi, J.B.[Jian-Bo],
iQuery: Instruments as Queries for Audio-Visual Sound Separation,
CVPR23(14675-14686)
IEEE DOI 2309
BibRef

Tan, R.[Reuben], Ray, A.[Arijit], Burns, A.[Andrea], Plummer, B.A.[Bryan A.], Salamon, J.[Justin], Nieto, O.[Oriol], Russell, B.[Bryan], Saenko, K.[Kate],
Language-Guided Audio-Visual Source Separation via Trimodal Consistency,
CVPR23(10575-10584)
IEEE DOI 2309
BibRef

Mo, S.T.[Shen-Tong], Tian, Y.P.[Ya-Peng],
Audio-Visual Grouping Network for Sound Localization from Mixtures,
CVPR23(10565-10574)
IEEE DOI 2309
BibRef

Sun, W.X.[Wei-Xuan], Zhang, J.Y.[Jia-Yi], Wang, J.Y.[Jian-Yuan], Liu, Z.Y.[Zhe-Yuan], Zhong, Y.[Yiran], Feng, T.P.[Tian-Peng], Guo, Y.D.[Yan-Dong], Zhang, Y.[Yanhao], Barnes, N.M.[Nick M.],
Learning Audio-Visual Source Localization via False Negative Aware Contrastive Learning,
CVPR23(6420-6429)
IEEE DOI 2309
BibRef

Buchanan, C.[Caleb], Bi, Y.[Ying], Xue, B.[Bing], Vennell, R.[Ross], Childerhouse, S.[Simon], Pine, M.K.[Matthew K.], Briscoe, D.[Dana], Zhang, M.J.[Meng-Jie],
Deep Convolutional Neural Networks for Detecting Dolphin Echolocation Clicks,
IVCNZ21(1-6)
IEEE DOI 2201
BibRef

Hu, X.[Xixi], Chen, Z.Y.[Zi-Yang], Owens, A.[Andrew],
Mix and Localize: Localizing Sound Sources in Mixtures,
CVPR22(10473-10482)
IEEE DOI 2210
Measurement, Visualization, Computational modeling, Instruments, Music, Pattern recognition, Vision + X BibRef

Xuan, H.Y.[Han-Yu], Wu, Z.L.[Zhi-Liang], Yang, J.[Jian], Yan, Y.[Yan], Alameda-Pineda, X.[Xavier],
A Proposal-based Paradigm for Self-supervised Sound Source Localization in Videos,
CVPR22(1019-1028)
IEEE DOI 2210
Location awareness, Interpolation, Annotations, Shape, Semantics, Manuals, Pattern recognition, Recognition: detection, Self- semi- meta- Vision + X BibRef

Chen, Z.Y.[Zi-Yang], Fouhey, D.F.[David F.], Owens, A.[Andrew],
Sound Localization by Self-supervised Time Delay Estimation,
ECCV22(XXVI:489-508).
Springer DOI 2211
BibRef

Wang, H.[Huasen], Gao, L.L.[Ling-Ling], Tan, Q.[Qianchao], Ji, L.P.[Lu-Ping],
Visual Sound Source Separation with Partial Supervision Learning,
ICIP22(2127-2131)
IEEE DOI 2211
Deep learning, Visualization, Source separation, Semisupervised learning, Benchmark testing, Audio-visual Matching BibRef

Zhou, X.C.[Xin-Chi], Zhou, D.Z.[Dong-Zhan], Hu, D.[Di], Zhou, H.[Hang], Ouyang, W.L.[Wan-Li],
Exploiting Visual Context Semantics for Sound Source Localization,
WACV23(5188-5197)
IEEE DOI 2302
Location awareness, Training, Visualization, Semantics, Feature extraction, Cognition, Algorithms: Vision + language and/or other modalities BibRef

Zhou, X.[Xinchi], Zhou, D.Z.[Dong-Zhan], Ouyang, W.L.[Wan-Li], Zhou, H.[Hang], Hu, D.[Di],
SeCo: Separating Unknown Musical Visual Sounds with Consistency Guidance,
WACV23(5157-5166)
IEEE DOI 2302
Training, Deep learning, Visualization, Costs, Instruments, System performance, Algorithms: Vision + language and/or other modalities BibRef

Chatterjee, M.[Moitreya], Le Roux, J.[Jonathan], Ahuja, N.[Narendra], Cherian, A.[Anoop],
Visual Scene Graphs for Audio Source Separation,
ICCV21(1184-1193)
IEEE DOI 2203
Training, Visualization, Source separation, Pipelines, Music, Training data, Multiple signal classification, Scene analysis and understanding BibRef

Rachavarapu, K.K.[Kranthi Kumar], Aakanksha, A.[Aakanksha], Sundaresha, V.[Vignesh], Rajagopalan, A.N.,
Localize to Binauralize: Audio Spatialization from Visual Sound Source Localization,
ICCV21(1910-1919)
IEEE DOI 2203
Location awareness, Visualization, Auditory system, Task analysis, Vision + language, Detection and localization in 2D and 3D BibRef

Senocak, A.[Arda], Ryu, H.G.[Hyeong-Gon], Kim, J.[Junsik], Kweon, I.S.[In So],
Less Can Be More: Sound Source Localization With a Classification Model,
WACV22(577-586)
IEEE DOI 2202
Location awareness, Training, Analytical models, Annotations, Task analysis, Visual Reasoning, Analysis and Understanding Audio-Visual learning BibRef

Shi, J.Y.[Jia-Yin], Ma, C.[Chao],
Unsupervised Sounding Object Localization with Bottom-Up and Top-Down Attention,
WACV22(2161-2170)
IEEE DOI 2202
Location awareness, Visualization, Correlation, Codes, Annotations, Manuals, Multimedia Applications BibRef

Zhu, L.Y.[Ling-Yu], Rahtu, E.[Esa],
V-SlowFast Network for Efficient Visual Sound Separation,
WACV22(2182-2192)
IEEE DOI 2202
Visualization, Computational modeling, Spectrogram, Deep Learning Vision and Sound BibRef

Cokelek, M.[Mert], Imamoglu, N.[Nevrez], Ozcinar, C.[Cagri], Erdem, E.[Erkut], Erdem, A.[Aykut],
Leveraging Frequency Based Salient Spatial Sound Localization to Improve 360° Video Saliency Prediction,
MVA21(1-5)
DOI Link 2109
Location awareness, Visualization, Social networking (online), Computational modeling, Predictive models, Streaming media, Observers BibRef

Tanaka, T.[Tomohiro], Shinozaki, T.[Takahiro],
Unsupervised Sound Source Localization From Audio-Image Pairs Using Input Gradient Map,
ICPR21(6501-6508)
IEEE DOI 2105
Location awareness, Backpropagation, Gradient methods, Image color analysis, Neural networks, Pattern recognition, input gradient BibRef

Nguyen, Q.[Quan], Richter, J.[Julius], Lauri, M.[Mikko], Gerkmann, T.[Timo], Frintrop, S.[Simone],
Improving mix-and-separate training in audio-visual sound source separation with an object prior,
ICPR21(5844-5851)
IEEE DOI 2105
Training, Visualization, Source separation, Instruments, Music, Robustness, Data models BibRef

Zhu, L.Y.[Ling-Yu], Rahtu, E.[Esa],
Visually Guided Sound Source Separation and Localization using Self-Supervised Motion Representations,
WACV22(2171-2181)
IEEE DOI 2202
BibRef
Earlier:
Visually Guided Sound Source Separation Using Cascaded Opponent Filter Network,
ACCV20(VI:409-426).
Springer DOI 2103
Location awareness, Source separation, Instruments, Video sequences, Detectors, Deep Learning vision + audio BibRef

Oya, T.[Takashi], Iwase, S.[Shohei], Natsume, R.[Ryota], Itazuri, T.[Takahiro], Yamaguchi, S.[Shugo], Morishima, S.[Shigeo],
Do We Need Sound for Sound Source Localization?,
ACCV20(VI:119-136).
Springer DOI 2103
BibRef

Chen, W.[Wei], Hu, R.M.[Rui-Min], Wang, X.C.[Xiao-Chen], Li, D.S.[Deng-Shi],
HRTF Representation with Convolutional Auto-encoder,
MMMod20(I:605-616).
Springer DOI 2003
Head-related transfer function. Sound direction. BibRef

Guan, D.Z.[Duan-Zheng], Li, D.S.[Deng-Shi], Cai, X.B.[Xue-Bei], Wang, X.C.[Xiao-Chen], Hu, R.M.[Rui-Min],
Perceptual Localization of Virtual Sound Source Based on Loudspeaker Triplet,
MMMod20(II:189-200).
Springer DOI 2003
BibRef

Qian, R.[Rui], Hu, D.[Di], Dinkel, H.[Heinrich], Wu, M.Y.[Meng-Yue], Xu, N.[Ning], Lin, W.Y.[Wei-Yao],
Multiple Sound Sources Localization from Coarse to Fine,
ECCV20(XX:292-308).
Springer DOI 2011
BibRef

Xu, X., Dai, B., Lin, D.,
Recursive Visual Sound Separation Using Minus-Plus Net,
ICCV19(882-891)
IEEE DOI 2004
acoustic signal processing, audio signal processing, neural nets, source separation, recursive visual sound separation, BibRef

Colangelo, F., Battisti, F., Carli, M., Neri, A., Calabró, F.,
Enhancing audio surveillance with hierarchical recurrent neural networks,
AVSS17(1-6)
IEEE DOI 1806
audio signal processing, recurrent neural nets, signal classification, signal detection, video surveillance, Training BibRef

Saggese, A., Strisciuglio, N., Vento, M., Petkov, N.,
A real-time system for audio source localization with cheap sensor device,
AVSS17(1-7)
IEEE DOI 1806
Gaussian processes, audio signal processing, biomimetics, feature extraction, microphones, Surveillance BibRef

Moon, S.K.[Sung-Kyu], Shon, S.[Suwon], Kim, W.[Wooil], Han, D.K.[David K.],
Generalized cross-correlation based noise robust abnormal acoustic event localization utilizing non-negative matrix factorization,
AVSS14(171-174)
IEEE DOI 1411
Acoustics BibRef

Stachurski, J.[Jacek], Netsch, L.[Lorin], Cole, R.[Randy],
Sound source localization for video surveillance camera,
AVSS13(93-98)
IEEE DOI 1311
Adaptive filters BibRef

Lecomte, S., Lengelle, R., Richard, C., Capman, F., Ravera, B.,
Abnormal events detection using unsupervised One-Class SVM: Application to audio surveillance and evaluation,
AVSBS11(124-129).
IEEE DOI 1111
BibRef

Salvati, D., Roda, A., Canazza, S., Foresti, G.L.,
Multiple acoustic sources localization using incident Signal Power comparison,
AVSBS11(77-82).
IEEE DOI 1111
BibRef

Han, Y.[Yi], Wu, C.N.[Chu-Na],
A new moving sound source localization method based on the time difference of arrival,
IASP10(118-122).
IEEE DOI 1004
BibRef

Li, C.Q.[Cong-Qing], Wu, F.[Fang], Dai, S.J.[Shi-Jie], Sun, L.X.[Li-Xin], Huang, H.[He], Sun, L.Y.[Li-Ying],
A Novel Method of Binaural Sound Localization Based on Dominant Frequency Separation,
CISP09(1-4).
IEEE DOI 0910
BibRef

Kwak, K.C.[Keun-Chang],
Sound Localization Based on Excitation Source Information for Intelligent Home Service Robots,
ICISP08(536-543).
Springer DOI 0807
BibRef

Keyrouz, F.[Fakheredine], Diepold, K.[Klaus], Keyrouz, S.[Shady],
High performance 3D sound localization for surveillance applications,
AVSBS07(563-566).
IEEE DOI 0709
BibRef

Valenzise, G., Gerosa, L., Tagliasacchi, M., Antonacci, F., Sarti, A.,
Scream and gunshot detection and localization for audio-surveillance systems,
AVSBS07(21-26).
IEEE DOI 0709
BibRef

Marzàbal, A.[Albert], Grau, A.[Antoni], Bolea, Y.[Yolanda],
Model-Based Localization Method by Non-speech Sound Via Wavelet Transform and Dynamic Neural Network,
CIARP06(363-370).
Springer DOI 0611
BibRef

Chapter on New Unsorted Entries, and Other Miscellaneous Papers continues in
Time of Arrival, ToA, Analysis .

Last update:Apr 18, 2024 at 11:38:49