Publications

2026

Combining SSL Speech Features, Contextual Transformers and Mamba Models for Realistic Audio Spoofing Detection. Luis Buera, Héctor Delgado, Daniele Colibro, Antonio Miguel, in IEEE ICASSP 2026, Barcelona, Spain, [IEEE Xplore]
On Deepfake Voice Detection - It’s All in the Presentation. Héctor Delgado, Giorgio Ramondetti, Emanuele Dalmasso, Gennady Karvitsky, Daniele Colibro, Haydar Talib, in IEEE ICASSP 2026, Barcelona, Spain, [IEEE Xplore] [arXiv.org]
ASVspoof 5: Evaluation of Spoofing, Deepfake, and Adversarial Attack Detection Using Crowdsourced Speech. Xin Wang, Héctor Delgado, Nicholas Evans, Xuechen Liu, Tomi Kinnunen, Hemlata Tak, Kong Aik Lee, Ivan Kukanov, Md Sahidullah, Massimiliano Todisco, Junichi Yamagishi, in IEEE Transactions on Audio, Speech and Language Processing, [IEEE Xplore] [arXivs.org]

2025

ASVspoof 5: Design, collection and validation of resources for spoofing, deepfake, and adversarial attack detection using crowdsourced speech. Xin Wang, Héctor Delgado, Hemlata Tak, Jee-weon Jung, Hye-jin Shim, Massimiliano Todisco, Ivan Kukanov, Xuechen Liu, Md Sahidullah, Tomi Kinnunen, Nicholas Evans, Kong Aik Lee, Junichi Yamagishi, Myeonghun Jeong, Ge Zhu, Yongyi Zang, You Zhang, Soumi Maiti, Florian Lux, Nicolas Müller, Wangyou Zhang, Chengzhe Sun, Shuwei Hou, Siwei Lyu, Sébastien Le Maguer, Cheng Gong, Hanjie Guo, Liping Chen, Vishwanath Singh, in Computer Speech & Language [ScienceDirect] [arXiv.org]

2024

Malacopula: Adversarial automatic speaker verification attacks using a neural-based generalised hammerstein model. Massimiliano Todisco, Michele Panariello, Xin Wang, Héctor Delgado, Kong Aik Lee, Nicholas Evans, in proc. in proc. ASVspoof 2024 Workshop, Kos, Greece [ISCA] [arXiv.org]
ASVspoof 5: Crowdsourced speech data, deepfakes, and adversarial attacks at scale. Xin Wang, Héctor Delgado, Hemlata Tak, Jee-weon Jung, Hye-jin Shim, Massimiliano Todisco, Ivan Kukanov, Xuechen Liu, Md Sahidullah, Tomi H Kinnunen, Nicholas Evans, Kong Aik Lee, Junichi Yamagishi, in proc. in proc. ASVspoof 2024 Workshop, Kos, Greece [ISCA]

2023

ASVspoof 2021: Towards spoofed and deepfake speech detection in the wild. Xuechen Liu, Xin Wang, Md Sahidullah, Jose Patino, Héctor Delgado, Tomi Kinnunen, Massimiliano Todisco, Junichi Yamagishi, Nicholas Evans, Andreas Nautsch, Kong Aik Lee, in IEEE/ACM Transactions on Audio, Speech, and Language Processing. [IEEE Xplore] [arXiv.org]
Introduction to voice presentation attack detection and recent advances. Md Sahidullah, Héctor Delgado, Massimiliano Todisco, Andreas Nautsch, Xin Wang, Tomi Kinnunen, Nicholas Evans, Junichi Yamagishi, Kong-Aik Lee, chapter in Handbook of Biometric Anti-Spoofing: Presentation Attack Detection and Vulnerability Assessment, Springer Nature Singapore. [arXiv.org]

2022

Baseline systems for the first spoofing-aware speaker verification challenge: score and embedding fusion. Hye-jin Shim, Hemlata Tak, Xuechen Liu, Hee-Soo Heo, Jee-weon Jung, Joon Son Chung, Soo-Whan Chung, Ha-Jin Yu, Bong-Jin Lee, Massimiliano Todisco, Héctor Delgado, Kong Aik Lee, Md Sahidullah, Tomi Kinnunen, Nicholas Evans, in proc. ODYSSEY 2022 – The Speaker and Language Recognition Workshop, Beijing, China. [ISCA]

2021

ASVspoof 2021: accelerating progress in spoofed and deepfake speech detection. Junichi Yamagishi, Xin Wang, Massimiliano Todisco, Md Sahidullah, Jose Patino, Andreas Nautsch, Xuechen Liu, Kong Aik Lee, Tomi Kinnunen, Nicholas Evans, Héctor Delgado, in proc. ASVspoof 2021 workshop. [ISCA])
Benchmarking and challenges in security and privacy for voice biometrics. Jean-Francois Bonastre, Héctor Delgado, Nicholas Evans, Tomi Kinnunen, Kong Aik Lee, Xuechen Liu, Andreas Nautsch, Paul-Gauthier Noe, Jose Patino, Md Sahidullah, Brij Mohan Lal Srivastava, Massimiliano Todisco, Natalia Tomashenko, Emmanuel Vincent, Xin Wang, Junichi Yamagishi, in proc. ISCA Symposium on Security & Privacy in Speech Communications. [ISCA])
Visualizing Classifier Adjacency Relations: A Case Study in Speaker Verification and Voice Anti-Spoofing. Tomi Kinnunen, Andreas Nautsch, Md. Sahidullah, Nicholas Evans, Xin Wang, Massimiliano Todisco, Héctor Delgado, Junichi Yamagishi, Kong Aik Lee, in proc. INTERSPEECH 2021, Brno, Czech Republic. [ISCA])
ASVspoof 2019: spoofing countermeasures for the detection of synthesized, converted and replayed speech. Andreas Nautsch, Xin Wang, Nicholas Evans, Tomi Kinnunen, Ville Vestman, Massimiliano Todisco, Héctor Delgado, Md Sahidullah, Junichi Yamagishi, Kong Aik Lee, in IEEE/ACM Transactions on Audio, Speech and Language. [arXiv.org]

2020

Tandem Assessment of Spoofing Countermeasures and Automatic Speaker Verification: Fundamentals. Tomi Kinnunen, Héctor Delgado, Nicholas Evans, Kong Aik Lee, Ville Vestman, Andreas Nautsch, Massimiliano Todisco, Xin Wang, Md Sahidullah, Junichi Yamagishi, Douglas A. Reynolds, in IEEE/ACM Transactions on Biometrics, Behavior, and Identity Science. [arXiv.org]
ASVspoof 2019: a large-scale public database of synthetized, converted and replayed speech. Xin Wang, Junichi Yamagishi, Massimiliano Todisco, Héctor Delgado, Andreas Nautsch, Nicholas Evans, Md Sahidullah, Ville Vestman, Tomi Kinnunen, Kong Aik Lee, Lauri Juvela, Paavo Alku, Yu-Huai Peng, Hsin-Te Hwang, Yu Tsao, Hsin-Min Wang, Sebastien Le Maguer, Markus Becker, Fergus Henderson, Rob Clark, Yu Zhang, Quan Wang, Ye Jia, Kai Onuma, Koji Mushika, Takashi Kaneda, Yuan Jiang, Li-Juan Liu, Yi-Chiao Wu, Wen-Chin Huang, Tomoki Toda, Kou Tanaka, Hirokazu Kameoka, Ingmar Steiner, Driss Matrouf, Jean-Francois Bonastre, Avashna Govender, Srikanth Ronanki, Jing-Xuan Zhang, Zhen-Hua Ling, in Computer, Speech & Language. [arXiv.org]

2019

I4U Submission to NIST SRE 2018: Leveraging from a Decade of Shared Experiences. Kong Aik Lee, Ville Hautamäki, Tomi H. Kinnunen, Hitoshi Yamamoto, Koji Okabe, Ville Vestman, Jing Huang, Guohong Ding, Hanwu Sun, Anthony Larcher, Rohan Kumar Das, Haizhou Li, Mickael Rouvier, Pierre-Michel Bousquet, Wei Rao, Qing Wang, Chunlei Zhang, Fahimeh Bahmaninezhad, Héctor Delgado, Massimiliano Todisco, in proc. INTERSPEECH 2019, Graz, Austria. [ISCA]
ASVspoof 2019: Future Horizons in Spoofed and Fake Audio Detection. Massimiliano Todisco, Xin Wang, Ville Vestman, Md. Sahidullah, Héctor Delgado, Andreas Nautsch, Junichi Yamagishi, Nicholas Evans, Tomi Kinnunen, Kong Aik Lee, in proc. INTERSPEECH 2019, Graz, Austria. [ISCA]
Preserving Privacy in Speaker and Speech Characterisation. Andreas Nautsch, Abelino Jiménez, Amos Treiber, Jascha Kolberg, Catherine Jasserand, Els Kindt, Héctor Delgado, Massimiliano Todisco, Mohamed Amine Hmani, Aymen Mtibaa, Mohammed Ahmed Abdelraheem, Alberto Abad, Francisco Teixeira, Driss Matrouf, Marta Gomez-Barrero, Dijana Petrovska-Delacrétaz, Gérard Chollet, Nicholas Evans, Thomas Schneider, Jean-François Bonastre, Bhiksha Raj, Isabel Trancoso, Christoph Busch, in Computer Speech & Language. [ScienceDirect]
Introduction to Voice Presentation Attack Detection and Recent Advances. Md Sahidullah, Héctor Delgado, Massimiliano Todisco, Tomi Kinnunen, Nicholas Evans, Junichi Yamagishi, Kong-Aik Lee, book chapter in Handbook of biometric anti-Spoofing. Presentation attack detection, [arXiv.org]

2018

ODESSA at Albayzin Speaker Diarization Challenge 2018. Jose Patino, Héctor Delgado, Ruiqing Yin, Hervé Bredin, Claude Barras, Nicholas Evans, in proc. IberSPEECH 2018, Barcelona, Spain. [ISCA]
ODESSA/PLUMCOT at Albayzin Multimodal Diarization Challenge 2018. Benjamin Maurice, Hervé Bredin, Ruiqing Yin, Jose Patino, Héctor Delgado, Claude Barras, Nicholas Evans, Camille Guinaudeau, in proc. IberSPEECH 2018, Barcelona, Spain. [ISCA]
Enhanced low-latency speaker spotting using selective cluster enrichment Jose Patino, Héctor Delgado and Nicholas Evans, in proc. International Conference of the Biometrics Special Interest Group (BIOSIG 2018), Darmstadt, Germany. [eurecom.fr]
The EURECOM submission to the first DIHARD Challenge. Jose Patino, Héctor Delgado and Nicholas Evans, in proc. INTERSPEECH 2018, Hyderabad, India. [ISCA]
Integrated presentation attack detection and automatic speaker verification: common features and Gaussian back-end fusion. Massimiliano Todisco, Héctor Delgado, Kong Aik Lee, Md Sahidullah, Nicholas Evans, Tomi Kinnunen and Junichi Yamagishi, in proc. INTERSPEECH 2018, Hyderabad, India. [ISCA]
Speech database and protocol validation using waveform entropy. Itshak Lapidot, Héctor Delgado, Massimiliano Todisco, Nicholas Evans and Jean-François Bonastre, in proc. INTERSPEECH 2018, Hyderabad, India. [ISCA]
ASVspoof 2017 Version 2.0: meta-data analysis and baseline enhancements. Héctor Delgado, Massimiliano Todisco, Md Sahidullah, Nicholas Evans, Tomi Kinnunen, Kong Aik Lee and Junichi Yamagishi, in proc. ODYSSEY 2018 – The Speaker and Language Recognition Workshop, Les Sables d’Olonne, France. [ISCA]
Low-latency speaker spotting with online diarization and detection. Jose Patino, Ruiqing Yin, Héctor Delgado, Hervé Bredin, Alain Komaty, Guillaume Wisniewski, Claude Barras, Nicholas Evans and Sébastien Marcel, in proc. ODYSSEY 2018 – The Speaker and Language Recognition Workshop, Les Sables d’Olonne, France. [ISCA]
An end-to-end spoofing countermeasure for automatic speaker verification using evolving recurrent neural networks. Giacomo Valenti, Héctor Delgado, Massimiliano Todisco, Nicholas Evans and Laurent Pilati, in proc. ODYSSEY 2018 – The Speaker and Language Recognition Workshop, Les Sables d’Olonne, France. [ISCA]
t-DCF: a detection cost function for the tandem assessment of spoofing countermeasures and automatic speaker verification. Tomi Kinnunen, Kong Aik Lee, Héctor Delgado, Nicholas Evans, Massimiliano Todisco, Md Sahidullah, Junichi Yamagishi and Douglas A. Reynolds, in proc. ODYSSEY 2018 – The Speaker and Language Recognition Workshop, Les Sables d’Olonne, France. [ISCA]

2017

Speaker change detection using binary key modelling with contextual information. Jose Patino, Héctor Delgado and Nicholas Evans, in proc. International Conference on Statistical Language and Speech Processing (SLSP), Le Mans, France. [eurecom.fr]
Impact of bandwidth and channel variation on presentation attack detection for speaker verification. Héctor Delgado, Massimiliano Todisco, Nicholas Evans, Md Sahidullah, Wei Ming Liu, Federico Alegre, Tomi Kinnunen and Benoit Fauve, in proc. International Conference of the Biometrics Special Interest Group (BIOSIG 2017), Darmstadt, Germany. [eurecom.fr]
The I4U mega fusion and collaboration for NIST speaker recognition evaluation 2016. K. A. Lee, V. Hautamäki, T. Kinnunen, A. Larcher, C. Zhang, A. Nautsch, T. Stafylakis, G. Liu, M. Rouvier, W. Rao, F. Alegre, J. Ma, M. W. Mak, A. K. Sarkar, H. Delgado, R. Saeidi, H. Aronowitz, A. Sizov, H. Sun, T. H. Nguyen, G. Wang, B. Ma, V. Vestman, M. Sahidullah, M. Halonen, A. Kanervisto, G. Le Lan, F. Bahmaninezhad, S. Isadskiy, C. Rathgeb, C. Busch, G. Tzimiropoulos, Q. Qian, Z. Wang, Q. Zhao, T. Wang, H. Li, J. Xue, S. Zhu, R. Jin, T. Zhao, P.-M. Bousquet, M. Ajili, W. B. Kheder, D. Matrouf, Z. H. Lim, C. Xu, H. Xu, X. Xiao, E. S. Chng, B. Fauve, K. Sriskandaraja, V. Sethu, W. W. Lin, D. A. L. Thomsen, Z.-H. Tan, M. Todisco, N. Evans, H. Li, J. H. L. Hansen, J.-F. Bonastre and E. Ambikairajah, in proc. INTERSPEECH 2017, Stockholm, Sweden. [ISCA]
The ASVspoof 2017 challenge: Assessing the limits of replay spoofing attack detection. Tomi Kinnunen, Md Sahidullah, Héctor Delgado, Massimiliano Todisco, Nicholas Evans, Junichi Yamagishi, Kong Aik Lee, in proc. INTERSPEECH 2017, Stockholm, Sweden. [ISCA]
Constant Q cepstral coefficients: a spoofing countermeasure for automatic speaker verification. Massimiliano Todisco, Héctor Delgado and Nicholas Evans, in Computer Speech & Language. [eurecom.fr]
ASVspoof: the automatic speaker verification spoofing and countermeasures challenge. Zhizheng Wu, Junichi Yamagishi, Tomi Kinnunen, Cemal Hanilçi, Md Sahidullah, Aleksandr Sizov, Nicholas Evans, Massimiliano Todisco and Héctor Delgado, in IEEE Journal of Selected Topics in Signal Processing (JSTSP). [uef.fi]
RedDots Replayed: A New Replay Spoofing Attack Corpus for Text-dependent Speaker Verification Research. Tomi Kinnunen, Md Sahidullah, Mauro Falcone, Luca Costantini, Rosa González Hautamaki, Dennis Thomsen, Achintya Sarkar, Zheng-Hua Tan, Héctor Delgado, Massimiliano Todisco, Nicholas Evans, Ville Hautamäki, Kong Aik Lee, in proc. ICASSP 2017, New Orleans, USA. [uef.fi]

2016

EURECOM submission to the Albayzin 2016 Speaker Diarization Evaluation. Jose Patino, Héctor Delgado, Nicholas Evans, Xavier Anguera, in proc. IberSPEECH 2016, Lisbon, Portugal. [eurecom.fr]
Further optimisations of constant Q cepstral processing for integrated utterance verification and text-dependent speaker verification. Héctor Delgado, Massimiliano Todisco, Md Sahidullah, Achintya K. Sarkar, Nicholas Evans, Tomi Kinnunen, Zheng-Hua Tan, in proc. IEEE Spoken Language Technology workshop SLT 2016, San Diego, USA. [eurecom.fr]
Articulation rate filtering of CQCC features for automatic speaker verification. Massimiliano Todisco, Héctor Delgado and Nicholas Evans, in proc. INTERSPEECH 2016, San Francisco, USA. [ISCA]
Integrated spoofing countermeasures and automatic speaker verification: an evaluation on ASVspoof 2015. Md Sahidullah, Héctor Delgado, Massimiliano Todisco, Hong Yu, Tomi Kinnunen, Nicholas Evans and Zheng-Hua Tan, in proc. INTERSPEECH 2016, San Francisco, USA. [ISCA]
Utterance verification for text-dependent speaker recognition: a comparative assessment using the RedDots corpus. Tomi Kinnunen, Md Sahidullah, I. Kukanov, Héctor Delgado, Massimiliano Todisco, A. Sarkar, N. Thomsen, V. Hautamaki, Nicholas Evans, and Zheng-Hua Tan, in proc. INTERSPEECH 2016, San Francisco, USA. [ISCA]
A new feature for automatic speaker verification anti-spoofing: Constant Q Cepstral Coefficients. Massimiliano Todisco, Héctor Delgado and Nicholas Evans, in proc. ODYSSEY 2016 – The Speaker and Language Recognition Workshop, Bilbao, Spain. [ISCA]
Semi-supervised on-line speaker diarization for meeting data with incremental maximum a-posteriori adaptation. Giovanni Soldi, Massimiliano Todisco, Héctor Delgado, Christophe Beaugeant and Nicholas Evans, in proc. ODYSSEY 2016 – The Speaker and Language Recognition Workshop, Bilbao, Spain. [ISCA]

2015

Albayzín-2014 evaluation: audio segmentation and classification in broadcast news domains. Diego Castán, David Tavarez, Paula Lopez-Otero, Javier Franco-Pedroso, Héctor Delgado, Eva Navas, Laura Docio-Fernández, Daniel Ramos, Javier Serrano, Alfonso Ortega and Eduardo Lleida, in EURASIP Journal on Audio, Speech, and Music Processing. [Springer]
Fast single- and cross-show speaker diarization using binary key speaker modeling. Héctor Delgado, Xavier Anguera, Corinne Fredouille and Javier Serrano, in IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP). [ResearchGate]
Speaker diarization and speech recognition in the semi-automatization of audio description: an exploratory study on future possibilities?. Héctor Delgado, Anna Matamala and Javier Serrano, in Cadernos de Traduçao. [SemanticSholar]
Novel clustering selection criterion for fast binary key speaker diarization. Héctor Delgado, Xavier Anguera, Corinne Fredouille and Javier Serrano, in proc. INTERSPEECH 2015, Dresden, Germany. [ISCA]
Improved binary key speaker diarization system. Héctor Delgado, Xavier Anguera, Corinne Fredouille and Javier Serrano, in proc. European Signal Processing Conference (EUSIPCO), Nice, France. [EURASIP]

2014

Global speaker clustering towards optimal stopping criterion in binary key speaker diarization. Héctor Delgado, Xavier Anguera, Corinne Fredouille and Javier Serrano, in proc. IberSpeech 2014, Las Palmas de Gran Canaria, Spain. [ResearchGate]
Albayzin 2014 Evaluation: TES-UAB Audio Segmentation System. Héctor Delgado and Javier Serrano, in proc. IberSpeech 2014, Las Palmas de Gran Canaria, Spain. [ResearchGate]
Towards a complete binary key system for the speaker diarization task. Héctor Delgado, Corinne Fredouille and Javier Serrano, in proc. INTERSPEECH 2014, Singapore. [ISCA]

2011

Enhancing Accessibility through Speech Technologies on AAL Telemedicine Services for iTV. Héctor Delgado, Aitor Rodriguez-Alsina, Antoni Gurguí, Enric Martí, Javier Serrano and Jordi Carrabina, in proc. Second International Joint Conference on Ambient Intelligence (AmI 2011), Amsterdam, The Netherlands, November 16-18, 2011. [ResearchGate]

2010

Automatic Metadata Extraction from Spoken Content using Speech and Speaker Recognition Techniques. Héctor Delgado, Javier Serrano and Jordi Carrabina, in proc. FALA 2010: “VI Jornadas en Tecnología del Habla” and II Iberian SLTech Workshop, Vigo, Spain, 2010. [ResearchGate]
Albayzin Evaluation: Audio Segmentation System at CEPHIS-UAB. Héctor Delgado, Javier Serrano and Jordi Carrabina, in proc. FALA 2010: “VI Jornadas en Tecnología del Habla” and II Iberian SLTech Workshop, Vigo, Spain, 2010. [ResearchGate]

Héctor Delgado, PhD

Publications