ICASSP 2023 Program

Forum

Jun 04 - 08:30 AM - 05:30 PM

Tutorial

Jun 04 - 08:30 AM - 12:00 PM

Tutorial

Jun 04 - 08:30 AM - 12:00 PM

Tutorial

Jun 04 - 08:30 AM - 12:00 PM

Tutorial

Jun 04 - 08:30 AM - 12:00 PM

Tutorial

Jun 04 - 08:30 AM - 12:00 PM

Tutorial

Jun 04 - 08:30 AM - 12:00 PM

Workshop

Jun 04 - 08:30 AM - 05:30 PM

Data Science and Learning Workshop (DSLW): Unraveling the Brain

Neuronal Cell Type Classification using Locally Sparse Networks
Ofek Ophir, Orit Shefi, Ofir Lindenbaum
A Sequence Agnostic Multimodal Pre-processing for Clogged Blood Vessel Detection in Alzheimer's Diagnosis
Partho Ghosh, Md. Abrar Istiak, Mir Sayeed Mohammad, Swapnil Saha, Uday Kamal
MODELING AND INFERENCE OF SPARSE NEURAL DYNAMIC FUNCTIONAL CONNECTIVITY NETWORKS UNDERLYING FUNCTIONAL ULTRASOUND DATA
Ruben Wijnands, Justin Dauwels, Ines Serra, Pieter Kruizinga, Aleksandra Badura, Borbala Hunyadi
GLM-Regularized Low-Rank Factorization for Extracting Functional Response from Swept-3D Functional Ultrasound
Aybüke Erol, Bastian Generowicz, Pieter Kruizinga, Borbala Hunyadi
Identification of Predictive Subnetwork for Brain Network-Based Psychiatric Diagnosis: an Information-Theoretic Perspective
Kaizhong Zheng, Shujian Yu, Badong Chen
Angular Central Gaussian and Watson Mixture Models for Assessing Dynamic Functional Brain Connectivity During a Motor Task
Anders Olsen, Emil Ortvald, Kristoffer Madsen, Mikkel Schmidt, Morten Mørup
Modeling nonlinear evoked hemodynamic responses in functional ultrasound
Sofia-Eirini Kotti, Aybüke Erol, Borbala Hunyadi
HIGHER-ORDER ORGANIZATION IN THE HUMAN BRAIN FROM MATRIX-BASED RÉNYI’S ENTROPY
Qiang Li, Shujian Yu, Kristoffer Madsen, Vince Calhoun, Armin Iraji
MULTI-MODAL DEEP LEARNING ON IMAGING GENETICS FOR SCHIZOPHRENIA CLASSIFICATION
Ayush Kanyal, Srinivas Kandula, Vince Calhoun, Dong Hye Ye
GENERATIVE MODELS FOR LARGE-SCALE SIMULATIONS OF CONNECTOME DEVELOPMENT
Skylar Brooks, Catherine Stamoulis
LOCAL SPATIAL FLOW STRENGTHS IN BOLD FMRI ARE STRONGLY IMPACTED BY SCHIZOPHRENIA
Robyn Miller, Victor Vergara, Helen Petropoulos, Vince Calhoun
Accelerated Magnetic Resonance Fingerprinting with Low-Rank and Generative Subspace Modeling
Hengfa Lu, Bo Zhao
FUSION OF MULTI-MODAL NEUROIMAGING DATA AND ASSOCIATION WITH COGNITIVE DATA
Mark D LoPresto, Mohammad Akhonda, Vince Calhoun, Tulay Adali
Deep generative transfer learning predicts conversion to Alzheimer's disease from neuroimaging genomics data
Giorgio Dolci, Md Abdur Rahaman, Ilaria Boscolo Galazzo, Federica Cruciani, Anees Abrol, Jiayu Chen, Zening Fu, Kuaikuai Duan, Gloria Menegaz, Vince Calhoun
DYNAMIC SOURCE LOCALIZATION AND FUNCTIONAL CONNECTIVITY ESTIMATION WITH STATE-SPACE MODELS: PRELIMINARY FEASIBILITY ANALYSIS
Jose M. Sanchez-Bornot, Roberto Sotero, Damien Coyle
Variability of Functional Connectomes Through Community Structure
Brooke A Osterkamp, Meiby Ortiz-Bouza, Selin Aviyente
Brain fingerprinting using fMRI spectral signatures on high-resolution cortical graphs
Carlo Ferritto, Maria Giulia Preti, Stefano Moia, Dimitri Van De Ville, Hamid Behjat

Workshop

Jun 04 - 08:30 AM - 05:30 PM

Integrated Sensing and Communications: New Frontiers, Newer Challenges

Industry

Jun 04 - 02:00 PM - 05:30 PM

Tutorial

Jun 04 - 02:00 PM - 05:30 PM

Tutorial

Jun 04 - 02:00 PM - 05:30 PM

Tutorial

Jun 04 - 02:00 PM - 05:30 PM

Tutorial

Jun 04 - 02:00 PM - 05:30 PM

Workshop

Jun 04 - 02:00 PM - 05:30 PM

WOSDETC-2023: International Workshop on Small Drone Surveillance, Detection and Counteraction Techniques & Drone-vs-Bird Detection Grand Challenge

Social

Jun 04 - 06:00 PM - 08:30 PM

Forum

Jun 05 - 08:30 AM - 05:30 PM

Industry

Jun 05 - 08:30 AM - 12:00 PM

Tutorial

Jun 05 - 08:30 AM - 12:00 PM

Tutorial

Jun 05 - 08:30 AM - 12:00 PM

Tutorial

Jun 05 - 08:30 AM - 12:00 PM

Tutorial

Jun 05 - 08:30 AM - 12:00 PM

Tutorial

Jun 05 - 08:30 AM - 12:00 PM

Workshop

Jun 05 - 08:30 AM - 12:00 PM

Signal Processing and Machine Learning to Foster Accessibility in Cultural Environments

Workshop

Jun 05 - 08:30 AM - 12:00 PM

HMM-QoE 2023: Humans, Machines and Multimedia: Quality of Experience and Beyond

Workshop

Jun 05 - 08:30 AM - 12:00 PM

OISAC: Opportunistic Integrated Sensing and Communication (ISAC) of Weather

SPS

Jun 05 - 02:00 PM - 06:00 PM

Tutorial

Jun 05 - 02:00 PM - 05:30 PM

Tutorial

Jun 05 - 02:00 PM - 05:30 PM

Tutorial

Jun 05 - 02:00 PM - 05:30 PM

Tutorial

Jun 05 - 02:00 PM - 05:30 PM

Workshop

Jun 05 - 02:00 PM - 05:30 PM

IWCIM 2023: The Eleventh International Workshop on Computational Intelligence for Multimedia Understanding

Modeling Lead-Lag Structure in Facial Expression Synchrony for Social-Psychological Outcome Prediction from Negotiation Interaction
Nobukatsu Hojo, Saki Mizuno, Satoshi Kobashikawa, Ryo Masumura
SUPERVISED IMAGE SEGMENTATION FOR HIGH DYNAMIC RANGE IMAGING
Ali Reza Omrani, Davide Moroni
OPTIMAL ORDER OF HIPPOCAMPAL PLACE CELL MODELS CONSTRUCTED USING EXPANSIONS OF ZERNIKE POLYNOMIALS AND POWER SERIES
Sleim Mohamed Margham, Murat Okatan
CluCDD: Contrastive Dialogue Disentanglement via Clustering
Jingsheng Gao, Zeyu Li, Suncheng Xiang, Ting Liu, Yuzhuo Fu
SDRV: Real-time On-device Subtitles Detection, Recognition and Voicing
Illya Degtyarenko, Nazarii Tkach, Olga Radyvonenko, Ivan Deriuga, Kostiantyn Seliuk, Oleksandr Ivanov, Valerii Sielikhov, Sang Young Lee, Youn-Ho Choi, Cheul-Hee Hahm
Software Module Classification for Commercial Bug Reports
Ceyhun Öztürk, Eyüp Halit Yılmaz, Ömer Köksal, AYKUT KOC
ROLE OF AUDIO IN VIDEO SUMMARIZATION
Ibrahim Shoer, Berkay Köprü, Engin Erzin
MEDICAL WASTE SORTING: A COMPUTER VISION APPROACH FOR ASSISTED PRIMARY SORTING
Antonio Bruno, Claudia Caudai, Giuseppe Leone, Massimo Martinelli, Davide Moroni, Francesco Crotti
Texture Quality Criteria Comparison
Michal Haindl, Nahidbanu Shaikh
CRYPTOSENTIMENT: A DATASET AND BASELINE FOR SENTIMENT-AWARE DEEP REINFORCEMENT LEARNING FOR FINANCIAL TRADING
Loukia Avramelou, Paraskevi Nousi, Nikolaos Passalis, Stavros Doropoulos, ANASTASIOS TEFAS
Generating Artistic Images via Few-Shot Style Transfer
Itay Buchnik, Or Berebi, Tammy Riklin Raviv, Nir Shlezinger
Incremental Image Labeling via Iterative Refinement
Fausto Giunchiglia, Xiaolei Diao, Mayukh Bagchi
FACE-DUBBING++: LIP-SYNCHRONOUS, VOICE PRESERVING TRANSLATION OF VIDEOS
Alexander Waibel, Moritz Behr, Dogucan Yaman, Fevziye Irem Eyiokur Yaman, Tuan-Nam Nguyen, Carlos Mullov, Mehmet Arif, Alperen Kantarcı, Stefan Constantin, HAZIM KEMAL EKENEL
State-of-the-Art in Nudity Classification: A Comparative Analysis
Fatih Cagatay Akyon, Alptekin Temizel
Scalable Missing Data Imputation with Graph Neural Networks
Guillaume Lachaud, Patricia CONDE CESPEDES, Maria Trocan
Evaluation of a Marine Mesoscale Events Classifier
Marco Reggiannini, Oscar Papini, Gabriele Pieri
Collaborative visual-inertial localization of teams with floorplan extraction
Sándor Gazdag, Dániel Pásztornicky, Zsolt Jankó, Tamás Szirányi, András Majdik
SieveNet : AN EFFICIENT MODEL UTILIZING H.265 CODEC STRUCTURE FOR VIDEO OBJECT DETECTION
Onur Can Koyun, Behçet Töreyin

Workshop

Jun 05 - 02:00 PM - 05:30 PM

EEG Workshop -- EEG Signal Processing for the Future: Integrating Insights Across Domains

Workshop

Jun 05 - 02:00 PM - 05:30 PM

SDPNGS 2023: Signal and Data Processing for Next Generation Satellites

Workshop

Jun 05 - 02:00 PM - 05:30 PM

Workshop

Jun 05 - 04:00 PM - 06:00 PM

Social

Jun 05 - 07:30 PM - 10:00 PM

General

Jun 06 - 08:15 AM - 09:45 AM

Plenary

Jun 06 - 09:45 AM - 10:45 AM

Short Course

Jun 06 - 10:00 AM - 12:00 PM

Short Course

Jun 06 - 10:00 AM - 12:00 PM

Oral

Jun 06 - 10:50 AM - 12:20 PM

Audio for Multimedia and Multimodal Processing

Mark Plumbley, Lin Wang

Poster

Jun 06 - 10:50 AM - 12:20 PM

Applications to Physiological Signals, Audio, and Speech

Chenshu Wu, Robin Rajamaki

Challenge

Jun 06 - 10:50 AM - 12:20 PM

Drone-vs-Bird Detection Challenge

Oral

Jun 06 - 10:50 AM - 12:20 PM

Human Identification and Face Recognition

Mang Ye, Lizhuang Ma

Poster

Jun 06 - 10:50 AM - 12:20 PM

Super Resolution

Chun Yuan, Xinbo Gao

Poster

Jun 06 - 10:50 AM - 12:20 PM

Denoising

Qiang Shen, Yijin Liu

Poster

Jun 06 - 10:50 AM - 12:20 PM

Semantic Segmentation

Tae-Kyun Kim, Xue Li

Poster

Jun 06 - 10:50 AM - 12:20 PM

Object Segmentation

Truong Nguyen, Tiejun Huang

Poster

Jun 06 - 10:50 AM - 12:20 PM

Oral

Jun 06 - 10:50 AM - 12:20 PM

Self-supervised Learning Methods I

Zheng-Hua Tan, Abeer Alwan

Poster

Jun 06 - 10:50 AM - 12:20 PM

Deep Learning for Image and Video Processing I

Shogo Muramatsu, Michel Barlaud

Poster

Jun 06 - 10:50 AM - 12:20 PM

Graph based Learning II

Jian Guan, Charilaos Kanatsoulis

Poster

Jun 06 - 10:50 AM - 12:20 PM

Learning from Multimodal Data

Mohsen Naqvi, Woon-Seng Gan

Poster

Jun 06 - 10:50 AM - 12:20 PM

Matrix/Tensor Factorization and Completion

Kejun Huang, Sebastian Miron

Oral

Jun 06 - 10:50 AM - 12:20 PM

ASR with Constrained Resource

Hung-yi Lee, Marco Siniscalchi

Oral

Jun 06 - 10:50 AM - 12:20 PM

ASR: Multilingual Speech Recognition

Michael Picheny, Tara Sainath

Poster

Jun 06 - 10:50 AM - 12:20 PM

ASR - Improve Latency, Efficiency, and Accuracy

Yossi Adi

Poster

Jun 06 - 10:50 AM - 12:20 PM

ASR: Domain Adaptation and Robust Training

Masakiyo Fujimoto, Soumi Maiti

Poster

Jun 06 - 10:50 AM - 12:20 PM

ASR: New Models

UCONV-CONFORMER: HIGH REDUCTION OF INPUT SEQUENCE LENGTH FOR END-TO-END SPEECH RECOGNITION
Andrei Andrusenko, Rauf Nasretdinov, Aleksei Romanenko
A Comparison of Semi-Supervised Learning Techniques for Streaming ASR at Scale
Charles C Peyser, Michael Picheny, Kyunghyun Cho, Tara Sainath, W. Ronny Huang, Rohit Prabhavalkar
Improving Contextual Biasing with Text Injection
Tara Sainath, Rohit Prabhavalkar, Diamantino Caseiro, Pat Rondon, Cyril Allauzen
STRUCTURED STATE SPACE DECODER FOR SPEECH RECOGNITION AND SYNTHESIS
Koichi Miyazaki, Masato Murata, Tomoki Koriyama
JEIT: JOINT END-TO-END MODEL AND INTERNAL LANGUAGE MODEL TRAINING FOR SPEECH RECOGNITION
Zhong Meng, Weiran Wang, Rohit Prabhavalkar, Tara Sainath, Tongzhou Chen, Ehsan Variani, Yu Zhang, Bo Li, Andrew Rosenberg, Bhuvana Ramabhadran
Variable Attention Masking for Configurable Transformer Transducer Speech Recognition
Pawel Swietojanski, Stefan Braun, Dogan Can, Thiago Fraga da Silva, Arnab Ghoshal, Takaaki Hori, Roger Hsiao, Henry Mason, Erik McDermott, Jan Silovsky, Ruchir Travadi, Xiaodan Zhuang
Factorized Blank Thresholding for Improved Runtime Efficiency of Neural Transducers
Duc Le, Frank Seide, Yuhao Wang, Yang Li, Kjell Schubert, Ozlem Kalinli, Mike Seltzer
Fast-U2++: Fast and Accurate End-to-End Speech Recognition in Joint CTC/Attention Frames
Chengdong Liang, Zhang XiaoLei, Binbin Zhang, Di Wu, Shengqiang Li, Xingchen Song, Zhendong Peng, Fuping Pan
Understanding Shared Speech-Text Representations
Yuan Wang, Kyle Kastner, Zhehuai Chen, Ankur Bapna, Andrew Rosenberg, Bhuvana Ramabhadran, Yu Zhang
Front-End Adapter: Adapting Front-End Input of Speech based Self-Supervised Learning for Speech Recognition
Xie Chen, Ziyang Ma, Changli Tang, Yujin Wang, Zhisheng Zheng
Lego-Features: Exporting modular encoder features for streaming and deliberation ASR
Rami Botros, Rohit Prabhavalkar, Johan Schalkwyk, Ciprian Chelba, Tara Sainath, Françoise Beaufays
Modular Conformer Training for Flexible End-to-End ASR
Kartik Audhkhasi, Brian Farris, Bhuvana Ramabhadran, Pedro J Moreno

Bhuvana Ramabhadran, Yongqiang Wang

Poster

Jun 06 - 10:50 AM - 12:20 PM

ASR: Noise Robustness

Marc Delcroix, Catalin Zorila

Oral

Jun 06 - 10:50 AM - 12:20 PM

Adaptive Signal Processing

Victor Solo, Konstantinos Slavakis

Oral

Jun 06 - 10:50 AM - 12:20 PM

6G Integrated Sensing and Communication (ISAC) from Theory to Practice – A Signal Processing Perspective

Jia He

Oral

Jun 06 - 02:00 PM - 03:30 PM

Audio Signal Restoration and Editing

Timo Gerkmann, Tomohiro Nakatani

Poster

Jun 06 - 02:00 PM - 03:30 PM

Machine Learning Applications

Robin Scheibler, Ryan Corey

Challenge

Jun 06 - 02:00 PM - 03:30 PM

Epilepsy Detection Grand Challenge

Oral

Jun 06 - 02:00 PM - 03:30 PM

Deep Learning Theory

Adrian Bors, Xiaoheng Deng

Poster

Jun 06 - 02:00 PM - 03:30 PM

Classification

C.-C. Jay Kuo, Ran Tao

Poster

Jun 06 - 02:00 PM - 03:30 PM

Human Posture Estimation

Nenghai Yu, Ce Zhu

Poster

Jun 06 - 02:00 PM - 03:30 PM

Human Reconstruction

Soo-Chang Pei, Kin-Man Lam

Poster

Jun 06 - 02:00 PM - 03:30 PM

Face Recognition

Bin Sun, Marios Savvides

Oral

Jun 06 - 02:00 PM - 03:30 PM

Neural Architecture Search

Hun Seok Kim, Ercan Kuruoglu

Poster

Jun 06 - 02:00 PM - 03:30 PM

Source Separation, ICA, and Sparsity

Wenwu Wang, Mohsen Naqvi

Poster

Jun 06 - 02:00 PM - 03:30 PM

Neural Sound Synthesis and Representation

Danilo Comminiello, Yossi Adi

Poster

Jun 06 - 02:00 PM - 03:30 PM

Deep Learning for Audio and Music Applications

Paola Garcia, Qiuqiang Kong

Poster

Jun 06 - 02:00 PM - 03:30 PM

Machine Learning for Image and Video Processing

Qing Liu, Demba Ba

Short Course

Jun 06 - 02:00 PM - 05:00 PM

Short Course

Jun 06 - 02:00 PM - 05:00 PM

Oral

Jun 06 - 02:00 PM - 03:30 PM

Expressive and Controllable TTS I

Haizhou Li, Junichi Yamagishi

Oral

Jun 06 - 02:00 PM - 03:30 PM

Keyword Spotting

Dimitris Dimitriadis, Arun Narayanan

Poster

Jun 06 - 02:00 PM - 03:30 PM

ASR: Text Adaptation

Jasha Droppo, Yanmin Qian

Poster

Jun 06 - 02:00 PM - 03:30 PM

ASR: Training Methods

Jinyu Li, Duc Le

Poster

Jun 06 - 02:00 PM - 03:30 PM

ASR: VAD and Other Topics I

Takashi Fuguda, Xie Chen

Poster

Jun 06 - 02:00 PM - 03:30 PM

ASR: VAD and Other Topics II

Jintao Jiang, Xiaohui Zhang

Oral

Jun 06 - 02:00 PM - 03:30 PM

Detection and Classification

Ignacio Santamaria, Jean-Philippe Ovarlez

Oral

Jun 06 - 02:00 PM - 03:30 PM

Advances in Signal Processing and Machine Learning for Non-Intrusive Load Monitoring

Iosif Mporas

Show and Tell

Jun 06 - 02:00 PM - 03:30 PM

Show and Tell Demos: Session 1

Oral

Jun 06 - 03:40 PM - 05:10 PM

Automatic Audio Captioning and Retrieval

Romain Serizel, Mark Cartwright

Poster

Jun 06 - 03:40 PM - 05:10 PM

Binaural Audio; Multichannel Source Separation

Zbynek Koldovsky, Shoko Araki

Challenge

Jun 06 - 03:40 PM - 05:10 PM

Auditory EEG Decoding Challenge

Oral

Jun 06 - 03:40 PM - 05:10 PM

Image Restoration

Christine Guillemot, Edward Choi

Poster

Jun 06 - 03:40 PM - 05:10 PM

Image/Video Caption Generation

Jing Ma, Xuequan Lu

Poster

Jun 06 - 03:40 PM - 05:10 PM

Flow Estimation

Franz Hlawatsch, Mahesan Niranjan

Poster

Jun 06 - 03:40 PM - 05:10 PM

Image/Video Retrieval

Bingbing Ni, Pan Zhou

Oral

Jun 06 - 03:40 PM - 05:10 PM

Interpretable and Explainable Machine Learning

Che Lin, Daphney-Stavroula Zois

Poster

Jun 06 - 03:40 PM - 05:10 PM

Transfer Learning II

Alexandros Iosifidis, Yanmin Qian

Poster

Jun 06 - 03:40 PM - 05:10 PM

Learning Theory and Algorithms II

Weiyu Xu, Krishna Pillutla

Poster

Jun 06 - 03:40 PM - 05:10 PM

Distributed and Federated Learning II

Tommy S. Alstrøm, Osvaldo Simeone

Poster

Jun 06 - 03:40 PM - 05:10 PM

Machine Learning for Telecommunications

Chang D. Yoo, Zhijin Qin

Oral

Jun 06 - 03:40 PM - 05:10 PM

Language Modeling

Michael Seltzer, Hainan Xu

Oral

Jun 06 - 03:40 PM - 05:10 PM

Language Modeling and Spoken Language Understanding

Wen Wang, Ahmed Hussen Abdelaziz

Poster

Jun 06 - 03:40 PM - 05:10 PM

Dialog and Multimodal Processing of Language

Samuel Thomas, Gerasimos Potamianos

Poster

Jun 06 - 03:40 PM - 05:10 PM

Discourse and Dialog

Chiori Hori, Sakriani Sakti

Poster

Jun 06 - 03:40 PM - 05:10 PM

Emerging Topics in Speech Synthesis

Berrak Sisman

Poster

Jun 06 - 03:40 PM - 05:10 PM

Audio and Text Segmentation, Tagging and Parsing

Hung-yi Lee, Atsunori Ogawa

Oral

Jun 06 - 03:40 PM - 05:10 PM

Estimation Theory and Methods

Arie Yeredor, Frédéric Pascal

Oral

Jun 06 - 03:40 PM - 05:10 PM

AI Security and Privacy in Speech and Audio Processing

Zhao Ren

Panel

Jun 06 - 05:15 PM - 06:45 PM

Perspectives

Jun 06 - 05:15 PM - 06:00 PM

Perspectives

Jun 06 - 05:15 PM - 06:00 PM

SPS

Jun 06 - 06:00 PM - 08:00 PM

Social

Jun 06 - 07:30 PM - 11:00 PM

Poster

Jun 07 - 08:15 AM - 09:45 AM

Image Restoration

Xuelong Li, Ju Sun

Oral

Jun 07 - 08:15 AM - 09:45 AM

Diffusion-Based Generative Models for Audio and Speech

Yuki Mitsufuji, Francois Germain

Poster

Jun 07 - 08:15 AM - 09:45 AM

Computer Vision Applications

Dong Hye Ye, Anthony Vetro

Challenge

Jun 07 - 08:15 AM - 09:45 AM

Challenge

Jun 07 - 08:15 AM - 09:45 AM

Multilingual Alzheimer’s Dementia Recognition through Spontaneous Speech (MADReSS)

Oral

Jun 07 - 08:15 AM - 09:45 AM

Image Recognition and Detection

Sheng Liu, Yu-Bin Yang

Poster

Jun 07 - 08:15 AM - 09:45 AM

Domain-Specific Detection

Hanzi Wang, F Richard Yu

Poster

Jun 07 - 08:15 AM - 09:45 AM

Temporal Video Analysis and Detection

Tyng-Luh Liu, Lijun Yin

Poster

Jun 07 - 08:15 AM - 09:45 AM

Object Detection

Kaihua Zhang, Haoran Xie

Oral

Jun 07 - 08:15 AM - 09:45 AM

Model Pruning and Compression

Bhaskar Rao, Sijia Liu

Poster

Jun 07 - 08:15 AM - 09:45 AM

Graph based Learning III

Nikolaos Deligiannis, Reza Zafarani

Poster

Jun 07 - 08:15 AM - 09:45 AM

Deep Learning for Image and Video Processing II

Alexandros Iosifidis, Nasim Yahyasoltani

Poster

Jun 07 - 08:15 AM - 09:45 AM

Deep Learning for Speech and Audio Processing I

Paola Garcia, Deliang Wang

Poster

Jun 07 - 08:15 AM - 09:45 AM

Deep Learning for Speech and Language Processing

Iván López-Espejo, Ning Ma

Oral

Jun 07 - 08:15 AM - 09:45 AM

Machine Learning Methods for Language I

Wen Wang, Zhehuai Chen

Oral

Jun 07 - 08:15 AM - 09:45 AM

Machine Translation and Dialog System

Satoshi Nakamura, Tanja Schultz

Poster

Jun 07 - 08:15 AM - 09:45 AM

Expressive and Controllable TTS II

Wang Xin

Poster

Jun 07 - 08:15 AM - 09:45 AM

Language Modeling and Representation Learning

Samuel Thomas, Atsunori Ogawa

Poster

Jun 07 - 08:15 AM - 09:45 AM

Lightweight TTS and TTS Analysis

Andros Tjandra

Poster

Jun 07 - 08:15 AM - 09:45 AM

Machine Translation for Spoken and Written Language

Markus Mueller, Jan Yenda Trmal

Oral

Jun 07 - 08:15 AM - 09:45 AM

Radar Waveform Design: Recent Advances and New Emerging Applications

Mohammad Alaee

Oral

Jun 07 - 08:15 AM - 09:45 AM

Conversational Healthcare Interfaces

Aki Harma

Short Course

Jun 07 - 09:00 AM - 12:00 PM

Short Course

Jun 07 - 09:00 AM - 12:00 PM

Plenary

Jun 07 - 09:45 AM - 10:45 AM

Oral

Jun 07 - 10:50 AM - 12:20 PM

Music Audio Synthesis and Modeling

Magdalena Fuentes, Kazuyoshi Yoshii

Poster

Jun 07 - 10:50 AM - 12:20 PM

Sensing Applications

Ranadip Pal

Poster

Jun 07 - 10:50 AM - 12:20 PM

Computational Imaging II

Bo Zhao

Challenge

Jun 07 - 10:50 AM - 12:20 PM

Spoken Language Understanding Grand Challenge

Oral

Jun 07 - 10:50 AM - 12:20 PM

Image Segmentation

Liujuan Cao, Kai Hu

Poster

Jun 07 - 10:50 AM - 12:20 PM

Anomaly Detection

Zhenhua Guo, Zhiqiang Wu

Poster

Jun 07 - 10:50 AM - 12:20 PM

Deep Neural Network

Yu-Bin Yang, Lizhuang Ma

Industry

Jun 07 - 10:50 AM - 12:20 PM

Poster

Jun 07 - 10:50 AM - 12:20 PM

Deep Learning II

Anastasios Tefas, Shuai Wan

Poster

Jun 07 - 10:50 AM - 12:20 PM

Deep and Sequential Learning

Yunpeng Li, Nir Shlezinger

Poster

Jun 07 - 10:50 AM - 12:20 PM

Machine learning for time series analysis II

Tommy S. Alstrøm, Ruud van Sloun

Poster

Jun 07 - 10:50 AM - 12:20 PM

Machine learning for time series analysis III

Ercan Kuruoglu, Vidhyasaharan Sethu

Oral

Jun 07 - 10:50 AM - 12:20 PM

Multi-speaker ASR

Reinhold Haeb-Umbach, Ozlem Kalinli

Oral

Jun 07 - 10:50 AM - 12:20 PM

Multimodal Processing of Language and Language Systems II

Jan Yenda Trmal, Paola Garcia

Poster

Jun 07 - 10:50 AM - 12:20 PM

Machine Learning Methods for Language II

Wen Wang

Poster

Jun 07 - 10:50 AM - 12:20 PM

Machine Learning Methods for Language III

Leibny Garcia Perera

Poster

Jun 07 - 10:50 AM - 12:20 PM

Machine Learning Methods for Language IV

Jan Yenda Trmal

Poster

Jun 07 - 10:50 AM - 12:20 PM

Multilingual Speech Recognition and Identification

Andreas Stolcke, Peter Bell

Oral

Jun 07 - 10:50 AM - 12:20 PM

Tracking

Yunpeng Li, Wenjing Yang

Oral

Jun 07 - 10:50 AM - 12:20 PM

Radar-Assisted Perception (RAP)

Pu Wang

Oral

Jun 07 - 10:50 AM - 12:20 PM

Data Driven and Machine Learning based Room Acoustic Modeling

Enzo De Sena, Wenyu Jin

Show and Tell

Jun 07 - 10:50 AM - 12:20 PM

Show and Tell Demos: Session 2

WISP

Jun 07 - 12:00 PM - 02:00 PM

Oral

Jun 07 - 02:00 PM - 03:30 PM

Sound Event Detection

Gaël Richard, Jonathan Le Roux

Poster

Jun 07 - 02:00 PM - 03:30 PM

Acoustic Sensor Array Processing and Sound Source Localization

Jesper Rindom Jensen

Oral

Jun 07 - 02:00 PM - 03:30 PM

Brain Connectivity

Tulay Adali

Poster

Jun 07 - 02:00 PM - 03:30 PM

Computational Imaging III

Chandra Sekhar Seelamantula

Challenge

Jun 07 - 02:00 PM - 03:30 PM

Speech Signal Improvement Signal Processing Grand Challenge 2023

Oral

Jun 07 - 02:00 PM - 03:30 PM

Anonymization and Data Privacy

Zeki Erkin, Fernando Perez-Gonzalez

Poster

Jun 07 - 02:00 PM - 03:30 PM

Deep Learning

Byonghyo Shim, Sergiy Vorobyov

Poster

Jun 07 - 02:00 PM - 03:30 PM

Representation Learning

Ju Sun, Ye Peng

Oral

Jun 07 - 02:00 PM - 03:30 PM

Machine Learning for Time Series Analysis I

Che Lin, Patrice Abry

Poster

Jun 07 - 02:00 PM - 03:30 PM

Adversarial machine learning II

Stefan Vlaski, Pin-Yu Chen

Poster

Jun 07 - 02:00 PM - 03:30 PM

Self-supervised Learning Methods II

Thuan Nguyen, Bjoern Schuller

Poster

Jun 07 - 02:00 PM - 03:30 PM

Learning Theory and Algorithms III

Tianyi Chen, Joao Mota

Poster

Jun 07 - 02:00 PM - 03:30 PM

Target Detection and Classification

Angelo Coluccia, Jianfeng Ren

Short Course

Jun 07 - 02:00 PM - 05:00 PM

Short Course

Jun 07 - 02:00 PM - 05:00 PM

Oral

Jun 07 - 02:00 PM - 03:30 PM

Natural Language Processing I

Zhengyuan Liu

Oral

Jun 07 - 02:00 PM - 03:30 PM

Pronunciation and Fluency Assessment

Eric Fosler-Lussier, Yossi Keshet

Poster

Jun 07 - 02:00 PM - 03:30 PM

Multimodal Processing of Language and Language Systems I

Jan Yenda Trmal

Poster

Jun 07 - 02:00 PM - 03:30 PM

Natural Language Processing II

Ji Wu

Poster

Jun 07 - 02:00 PM - 03:30 PM

Natural Language Processing III

Samridhi Choudhary

Oral

Jun 07 - 02:00 PM - 03:30 PM

Quantum Computing for Machine Learning and Signal Processing

Vassilis Kekatos

Oral

Jun 07 - 02:00 PM - 03:30 PM

Edge Learning for Emerging Wireless Technologies

Paolo Di Lorenzo, George Alexandropoulos, Mattia Merluzzi

Poster

Jun 07 - 02:00 PM - 03:30 PM

Spatial Processing for Audio and Speech

Walter Kellermann, Timo Gerkman

Show and Tell

Jun 07 - 02:00 PM - 03:30 PM

Show and Tell Demos: Session 3

Poster

Jun 07 - 03:35 PM - 05:05 PM

Active Noise Control, Echo Reduction and Feedback Reduction

Gerald Enzner

Poster

Jun 07 - 03:35 PM - 05:05 PM

Anomaly Detection and Representation Learning for Audio Classification

Toni Heittola

Oral

Jun 07 - 03:35 PM - 05:05 PM

Brain Computer Interfaces

Toshihasa Tanaka

Challenge

Jun 07 - 03:35 PM - 05:05 PM

Acoustic Echo Cancellation Signal Processing Grand Challenge 2023

Poster

Jun 07 - 03:35 PM - 05:05 PM

Data Processing

Xuelong Li, Heinz Handels

Poster

Jun 07 - 03:35 PM - 05:05 PM

Perceptual Assessment

Jinli Suo, Wenming Yang

Oral

Jun 07 - 03:35 PM - 05:05 PM

Learning Theory and Algorithms I

Qing Qu, Peter Gerstoft

Poster

Jun 07 - 03:35 PM - 05:05 PM

Machine Learning for Recommendation, Search and other Applications

Daphney-Stavroula Zois, Chang D. Yoo

Poster

Jun 07 - 03:35 PM - 05:05 PM

Reinforcement Learning I

Antonio García Marqués, Ceyhun Eksin

Poster

Jun 07 - 03:35 PM - 05:05 PM

Deep Learning for Speech and Audio Processing II

Yang Liu, Thushara Abhayapala

Poster

Jun 07 - 03:35 PM - 05:05 PM

Pattern Recognition and Classification I

Yuexian Zou, Tales Imbiriba

Oral

Jun 07 - 03:35 PM - 05:05 PM

DoA Estimation

Martin Haardt, Peter Gerstoft

Poster

Jun 07 - 03:35 PM - 05:05 PM

Sparsity, Compressed Sensing, and Tensor Decomposition

Geert Leus, André L. F. de Almeida

Oral

Jun 07 - 03:35 PM - 05:05 PM

Speaker Recognition I: Scoring, Fairness, Privacy

Jahangir Alam, Man-Wai MaK

Oral

Jun 07 - 03:35 PM - 05:05 PM

Speaker Recognition II: Verification, Diarization, Anti-spoofing

Massimiliano Todisco, Jenthe Thienpondt

Poster

Jun 07 - 03:35 PM - 05:05 PM

Natural Language Processing IV

Pegah Kharazmi

Poster

Jun 07 - 03:35 PM - 05:05 PM

Resource Constrained ASR

Samuel Thomas, Jen-Tzung Chien

Poster

Jun 07 - 03:35 PM - 05:05 PM

Singing Voice Synthesis/Conversion and Pretrained TTS

Erica Cooper

Oral

Jun 07 - 03:35 PM - 05:05 PM

Recent Advances in Robust Learning for Modern Computational Imaging

M. Salman Asif

Oral

Jun 07 - 03:35 PM - 05:05 PM

Signal Processing and Machine Learning for Networked Autonomous Agents

Siwei Zhang, Francesco Guidi, Anna Guerra

Panel

Jun 07 - 05:15 PM - 06:45 PM

Perspectives

Jun 07 - 05:15 PM - 06:00 PM

Perspectives

Jun 07 - 05:15 PM - 06:00 PM

Social

Jun 07 - 07:30 PM - 10:00 PM

Poster

Jun 08 - 08:15 AM - 09:45 AM

Audio and Speech Quality Measurements

Ante Jukić

Poster

Jun 08 - 08:15 AM - 09:45 AM

Acoustic Modeling; Auditory Modeling for Hearing Instruments

Antoine Deleforge

Oral

Jun 08 - 08:15 AM - 09:45 AM

Medical Image Reconstruction

Ulugbek Kamilov

Challenge

Jun 08 - 08:15 AM - 09:45 AM

L3DAS23: Learning 3D Audio Sources for Audio-Visual Extended Reality

Oral

Jun 08 - 08:15 AM - 09:45 AM

Multimedia Forensics

Image Sharing Chain Detection via Sequence-to-Sequence Model
Jiaxiang You, Yuanman Li, Rongqin Liang, Yuxuan Tan, Jiantao Zhou, Xia Li
CONTENT-INSENSITIVE DYNAMIC LIP FEATURE EXTRACTION FOR VISUAL SPEAKER AUTHENTICATION AGAINST DEEPFAKE ATTACKS
Zihao Guo, shilin wang
EXPLOITING PRNU AND LINEAR PATTERNS IN FORENSIC CAMERA ATTRIBUTION UNDER COMPLEX LENS DISTORTION CORRECTION
Andrea AM Montibeller, Fernando Perez-Gonzalez
WHICH COUNTRY IS THIS PICTURE FROM? NEW DATA AND METHODS FOR DNN-BASED COUNTRY RECOGNITION
Omran Alamayreh, Giovanna Dimitri, Jun Wang, Benedetta Tondi, Mauro Barni
UNTAG: Learning Generic Features for Unsupervised Type-Agnostic Deepfake Detection
Nesryne Mejri, Enjie Ghorbel, Djamila Aouada
A 3D-ASSISTED FRAMEWORK TO EVALUATE THE QUALITY OF HEAD MOTION REPLICATION BY REENACTMENT DEEPFAKE GENERATORS
Sahar Husseini, Jean-Luc DUGELAY, Fabien Aili, Emmanuel Nars
Audio Cross Verification Using Dual Alignment Likelihood Ratio Test
Heidi Lei, Arm Wonghirundacha, Irmak Bukey, Timothy Tsai
Classification of Synthetic Facial Attributes by Means of Hybrid Classification/Localization Patch-based Analysis
Jun Wang, Benedetta Tondi, Mauro Barni
Learning Expressive and Generalizable Motion Features for Face Forgery Detection
Jingyi Zhang, Peng Zhang, Jingjing Wang, Di Xie, Shiliang Pu
DOUBLE COMPRESSION DETECTION BASED ON THE DE-BLOCKING FILTERING OF HEVC VIDEOS
Xiangui Kang, pengcheng su, Zisheng Huang, Yifang Chen, Jie Wang
Electric Network Frequency Detection Using Least Absolute Deviations
Christos Korgialas, Constantine Kotropoulos
Hearing and Seeing Abnormality: Self-supervised Audio-Visual Mutual Learning for Deepfake Detection
ChangSung Sung, Jun-Cheng Chen, Chu-Song Chen
Two-branch multi-scale deep neural network for generalized document recapture attack detection
Li Jiaxing, Chenqi KONG, Shiqi Wang, Haoliang Li
LEARNING TO LOCATE THE TEXT FORGERY IN SMARTPHONE SCREENSHOTS
Zeqin Yu, Bin Li, Yuzhen Lin, Jinhua Zeng, Jishen Zeng
MAKE YOUR ENEMY YOUR FRIEND: IMPROVING IMAGE ROTATION ANGLE ESTIMATION WITH HARMONICS
yu kun, Morteza Darvish Morshedi Hosseini, Anjie Peng, Hui Zeng, Miroslav Goljan
On the detection of synthetic images generated by diffusion models
Riccardo Corvi, Davide Cozzolino, Giada Zingarini, GIovanni Poggi, Koki Nagano, Luisa Verdoliva
TRUSTERA: A LIVE CONVERSATION REDACTION SYSTEM
Evandro Gouvea, Ali Dadgar, Shahab Jalalvand, Rathi Chengalvarayan, Badrinath Jayakumar, Ryan Price, Nicholas Ruiz, Jennifer McGovern, Srinivas Bangalore, Ben Stern
Prototype-Based Layered Federated Cross-Modal Hashing
Jiale Liu, Yu-Wei Zhan, Xin Luo, Zhen-Duo Chen, Yongxin Wang, Xin-Shun Xu

Paolo Bestagini, Mauro Barni

Poster

Jun 08 - 08:15 AM - 09:45 AM

Anonymization, Data Privacy, and Biometrics

Zeki Erkin, Mauro Barni

Poster

Jun 08 - 08:15 AM - 09:45 AM

Object Recognition

Wei Feng, Weiming Hu

Poster

Jun 08 - 08:15 AM - 09:45 AM

Identification Detection

Fanman Meng, Nenghai Yu

Oral

Jun 08 - 08:15 AM - 09:45 AM

Distributed and Federated Learning I

Qing Liu, Kobi Cohen

Poster

Jun 08 - 08:15 AM - 09:45 AM

Pattern Recognition and Classification II

Li Liu, Shahrokh Valaee

Poster

Jun 08 - 08:15 AM - 09:45 AM

Pattern Recognition and Classification III

Mingmin Chi, Pavel Andreev

Oral

Jun 08 - 08:15 AM - 09:45 AM

MIMO Radars and Waveform Design

Sergiy Vorobyov, Rick S Blum

Poster

Jun 08 - 08:15 AM - 09:45 AM

Tracking, Data Fusion, and Sensor Networks

Alexander Bertrand, Giuseppe Abreu

Oral

Jun 08 - 08:15 AM - 09:45 AM

Speech Dysarthria

Stefan Goetze, Sudarsana Kadiri

Oral

Jun 08 - 08:15 AM - 09:45 AM

Speech Emotion Recognition: General Topics I

Chi-Chun Lee, Jaebok Kim

Poster

Jun 08 - 08:15 AM - 09:45 AM

Speaker Recognition III: Neural Network Architecture

Themos Stafylakis

Poster

Jun 08 - 08:15 AM - 09:45 AM

Speaker Recognition V: Anti-spoofing and Verification

Yanmin Qian, Pierre-Michel Bousquet

Poster

Jun 08 - 08:15 AM - 09:45 AM

Speech Analysis

Stefan Goetze

Poster

Jun 08 - 08:15 AM - 09:45 AM

Bayesian Signal Processing

Victor Elvira, Tales Imbiriba

Oral

Jun 08 - 08:15 AM - 09:45 AM

Intelligent and Semantic Communications for 5G Mobile Networks and Beyond

Zhaohui Yang, Mingzhe Chen

Short Course

Jun 08 - 09:00 AM - 12:00 PM

Short Course

Jun 08 - 09:00 AM - 12:00 PM

Plenary

Jun 08 - 09:45 AM - 10:45 AM

Poster

Jun 08 - 10:50 AM - 12:20 PM

Medical and Environmental Acoustics; Audio Security

Dimitra Emmanouilidou

Poster

Jun 08 - 10:50 AM - 12:20 PM

Classification of Acoustic Scenes and Events

Annamaria Mesaros

Oral

Jun 08 - 10:50 AM - 12:20 PM

Learning from Neuroimaging Data

Javier Escudero

Poster

Jun 08 - 10:50 AM - 12:20 PM

Learning from EEG Data

Justin Dauwels

Poster

Jun 08 - 10:50 AM - 12:20 PM

Physiological Signal Processing I

Gloria Menegaz

Challenge

Jun 08 - 10:50 AM - 12:20 PM

Lightweight, Multi-Speaker, Multi-Lingual Indic Text-to-Speech

Poster

Jun 08 - 10:50 AM - 12:20 PM

Adversarial Machine Learning and Information Theoretic Security

Marc Chaumont, Paolo Bestagini

Poster

Jun 08 - 10:50 AM - 12:20 PM

Watermarking, Data Hiding and Human Factors in Security

Fernando Perez-Gonzalez, Marc Chaumont

Oral

Jun 08 - 10:50 AM - 12:20 PM

Quality Assessment and Anomaly Detection

Aykut Erdem, Ross Cutler

Poster

Jun 08 - 10:50 AM - 12:20 PM

3D Point Cloud/Stereo Video

Zhihong Zhang, Patrick Le Callet

Poster

Jun 08 - 10:50 AM - 12:20 PM

Face Processing

Bo Peng, Zhiyong Wu

Oral

Jun 08 - 10:50 AM - 12:20 PM

Deep Learning I

Robert Jenssen, Luana Ruiz

Oral

Jun 08 - 10:50 AM - 12:20 PM

Human-Centric Multimedia and Human-Machine Interaction

Ron Hecht, Chaker Larabi

Poster

Jun 08 - 10:50 AM - 12:20 PM

MIMO Radars and MIMO Communications

Fulvio Gini, Sundeep Prabhakar Chepuri

Oral

Jun 08 - 10:50 AM - 12:20 PM

Speech Emotion Recognition: Transfer Learning

Carlos Busso, Douglas O'Shaughnessy

Poster

Jun 08 - 10:50 AM - 12:20 PM

Speaker Recognition IV: Verification and Diarization

Ming Li, Alicia Lozano Diez

Poster

Jun 08 - 10:50 AM - 12:20 PM

Speaker Recognition VI: Diarization

Leibny Garcia Perera, Kong Aik Lee

Poster

Jun 08 - 10:50 AM - 12:20 PM

Speech Production, Perception,and Psychoacoustics

Yossi Kshet

Oral

Jun 08 - 10:50 AM - 12:20 PM

Multi-Antenna Communications and Sensing

Osvaldo Simeone

Poster

Jun 08 - 10:50 AM - 12:20 PM

Estimation, Detection, and Classification

Koby Todros, Vikram Krishnamurthy

Oral

Jun 08 - 10:50 AM - 12:20 PM

Learning on graphs for biology and medicine

Dorina Thanou

Oral

Jun 08 - 10:50 AM - 12:20 PM

Quantum Machine Learning Algorithms and Applications on NISQ Devices

Jun Qi, Min-Hsiu Hsieh, Mohammadreza Noormandipour

Poster

Jun 08 - 10:50 AM - 12:20 PM

Neural speech and audio coding: emerging challenges and opportunities

Minje Kim, Jan Skoglund

Show and Tell

Jun 08 - 10:50 AM - 12:20 PM

Show and Tell Demos: Session 4

SPS

Jun 08 - 12:00 PM - 03:00 PM

Poster

Jun 08 - 02:00 PM - 03:30 PM

Deep Learning-Based Source Separation II

Emmanuël Habets

Poster

Jun 08 - 02:00 PM - 03:30 PM

Deep Learning-Based Source Separation I

Lukas Drude

Poster

Jun 08 - 02:00 PM - 03:30 PM

Medical Image Segmentation

Richard Hendricks

Poster

Jun 08 - 02:00 PM - 03:30 PM

Bioinformatics

Abin Jose

Challenge

Jun 08 - 02:00 PM - 03:30 PM

ICASSP2023 General Meeting Understanding and Generation (MUG) Challenge

Poster

Jun 08 - 02:00 PM - 03:30 PM

Cybersecurity, Hardware and Network Security

Mauro Barni, Fernando Perez-Gonzalez

Oral

Jun 08 - 02:00 PM - 03:30 PM

Model Lightweight and Video Compression

Dongsheng Li, Adrian Bors

Oral

Jun 08 - 02:00 PM - 03:30 PM

Subspace and Manifold Learning

Wei Dai, Weiyu Xu

Poster

Jun 08 - 02:00 PM - 03:30 PM

Multimedia Compression and Quality

Luis Herranz, Aladine Chetouani

Poster

Jun 08 - 02:00 PM - 03:30 PM

Multimedia Analysis, Synthesis, and Learning

Tanaya Guha

Panel

Jun 08 - 02:00 PM - 03:30 PM

Poster

Jun 08 - 02:00 PM - 03:30 PM

DoA Estimation and Beamforming

Wei Liu, Yan Chen

Short Course

Jun 08 - 02:00 PM - 05:00 PM

Short Course

Jun 08 - 02:00 PM - 05:00 PM

Oral

Jun 08 - 02:00 PM - 03:30 PM

Speech Enhancement - Diffusion and Other Generative Models

Timo Gerkmann, Yu Tsao

Poster

Jun 08 - 02:00 PM - 03:30 PM

Speech Emotion Recognition: General Topics II

Laurence Devillers, Theodora Chaspari

Poster

Jun 08 - 02:00 PM - 03:30 PM

Speech Emotion Recognition: Multimodality

Engin Erzin, Prasanta Ghosh

Poster

Jun 08 - 02:00 PM - 03:30 PM

Speech Emotion Recognition: Neural Architectures

Bjorn Schuller

Poster

Jun 08 - 02:00 PM - 03:30 PM

Multi-Antenna Communications and Intelligent Reflecting Surfaces

George Alexandropoulos

Poster

Jun 08 - 02:00 PM - 03:30 PM

Optimization methods for signal processing

Geert Leus, Emilie Chouzenoux

Oral

Jun 08 - 02:00 PM - 03:30 PM

Signal Processing for Smart City Applications and the Internet of Things

Petros Spachos, Konstantinos Plataniotis

Oral

Jun 08 - 02:00 PM - 03:30 PM

Symbol-Level Precoding: Recent Advance and New Applications in 6G and Beyond

Hei Victor Cheng

Oral

Jun 08 - 02:00 PM - 03:30 PM

Graphical Inference and Modeling in Dynamical Systems

Emilie Chouzenoux, Petar Djuric

Show and Tell

Jun 08 - 02:00 PM - 03:30 PM

Show and Tell Demos: Session 5

Poster

Jun 08 - 03:35 PM - 05:05 PM

Multichannel Speech Enhancement, Dereverberation, and System Identification

Simon Doclo

Poster

Jun 08 - 03:35 PM - 05:05 PM

Multilabel Acoustic Event Classification

Shoko Araki

Poster

Jun 08 - 03:35 PM - 05:05 PM

Deep Learning for Medical Imaging

Vishal Monga

Challenge

Jun 08 - 03:35 PM - 05:05 PM

5TH DNS CHALLENGE AT IEEE ICASSP 2023

Oral

Jun 08 - 03:35 PM - 05:05 PM

Human Action Recognition

Haoqian Wang, Joon Son Chung

Poster

Jun 08 - 03:35 PM - 05:05 PM

Aspects in Image Generation/Analysis

Zhenhua Guo, Zhiqiang Wu

Oral

Jun 08 - 03:35 PM - 05:05 PM

Deep Generative Model

Wenwu Wang, George Fazekas

Oral

Jun 08 - 03:35 PM - 05:05 PM

Multimodal Signal Processing and Analysis I

Tanaya Guha

Poster

Jun 08 - 03:35 PM - 05:05 PM

Machine/Deep Learning Methodologies for Multimedia

Aladine Chetouani

Poster

Jun 08 - 03:35 PM - 05:05 PM

Human-Centric Multimedia

Theodora Chaspari, Antonio Pinheiro

Poster

Jun 08 - 03:35 PM - 05:05 PM

Source Localization and Separation

Anna Guerra, Emilie Chouzenoux

Oral

Jun 08 - 03:35 PM - 05:05 PM

Speech Enhancement - Self-Supervised Learning

Takuya Yoshioka, Shinji Watanabe

Poster

Jun 08 - 03:35 PM - 05:05 PM

Speech Enhancement /Audio-Visual, Multi-Channel, and Other

Extreme bandwidth extension network applied to speech signals captured with noise-resilient body-conduction microphones
Julien Hauret, Thomas Joubaud, Véronique Zimpfer, Éric BAVU
LA-VocE: Low-SNR Audio-visual Speech Enhancement using Neural Vocoders
Rodrigo Mira, Buye Xu, Jacob Donley, Anurag Kumar, Stavros Petridis, Vamsi Krishna Ithapu, Maja Pantic
A MULTI-SCALE FEATURE AGGREGATION BASED LIGHTWEIGHT NETWORK FOR AUDIO-VISUAL SPEECH ENHANCEMENT
Haitao Xu, Liangfa Wei, Jie Zhang, Jianming Yang, Yannan Wang, Tian Gao, Xin Fang, Lirong Dai
Deep Subband Network for Joint Suppression of Echo, Noise and Reverberation in Real-Time Fullband Speech Communication
Feifei Xiong, Minya Dong, Kechenying Zhou, Houwei Zhu, Jinwei Feng
Nonparallel High-Quality Audio Super Resolution with Domain Adaptation and Resampling CycleGANs
Reo Yoneyama, Ryuichi Yamamoto, Kentaro Tachibana
Two-stage UNet with multi-axis gated multilayer perceptron for monaural noisy-reverberant speech enhancement
Zehua Zhang, Shiyun Xu, Xuyi Zhuang, Lianyu Zhou, Heng Li, Mingjiang Wang, Harbin Institute of Technology Shenzhen
Audio-visual Speech Enhancement with a Deep Kalman Filter Generative Model
Ali Golmakani, Mostafa Sadeghi, romain serizel
Egocentric Audio-Visual Noise Suppression
Roshan S Sharma, Weipeng He, Egor Lakomkin, Ju Lin, Yang Liu, Kaustubh Kalgaonkar
The 2nd Clarity Enhancement Challenge for hearing aid speech intelligibility enhancement: Overview and Outcomes
Michael Akeroyd, Will Bailey, Jon Barker, Trevor Cox, John F Culling, Simone Graetzer, Graham Naylor, Zuzanna Podwinska, Zehai Tu
Incorporating Visual Information Reconstruction into Progressive Learning for Optimizing Audio-Visual Speech Enhancement
Chen-Yue Zhang, Hang Chen, Jun Du, Baocai Yin, Jia Pan, Chin-hui Lee
Alias-and-Separate: Wideband Speech Coding Using Sub-Nyquist Sampling and Speech Separation
Soojoong Hwang, Eunkyun Lee, Inseon Jang, Jong Won Shin
DeFT-AN: Dense Frequency-Time Attentive Network for Multichannel Speech Enhancement
Dongheon Lee, Jung-Woo Choi

Li Li, sabato marco siniscalchi

Poster

Jun 08 - 03:35 PM - 05:05 PM

Speech Enhancement - Separation and Target Speech Extraction

Shoko Araki, Katerina Zmolikova

Poster

Jun 08 - 03:35 PM - 05:05 PM

Speech Enhancement - Single Channel

Jun Du, Emanuel Habets

Oral

Jun 08 - 03:35 PM - 05:05 PM

Distributed and Reliable Signal Processing and Communications

Waheed Bajwa

Poster

Jun 08 - 03:35 PM - 05:05 PM

Machine Learning Applications to Communications

Zhongyuan Zhao

Poster

Jun 08 - 03:35 PM - 05:05 PM

Multi-Antenna and Multi-Carrier Communications

Tareq Al-Naffouri

Poster

Jun 08 - 03:35 PM - 05:05 PM

Signal Filtering, Restoration, Enhancement, and Reconstruction

Mojtaba Soltanalian, Shunsuke Ono

Oral

Jun 08 - 03:35 PM - 05:05 PM

Resource-efficient Real-time Neural Speech Separation

Zhong-Qiu Wang

Oral

Jun 08 - 03:35 PM - 05:05 PM

Panel

Jun 08 - 03:40 PM - 05:40 PM

Perspectives

Jun 08 - 05:15 PM - 06:00 PM

Perspectives

Jun 08 - 05:15 PM - 06:00 PM

Poster

Jun 09 - 08:15 AM - 09:45 AM

Music Classification and Transcription

Geoffroy Peeters

Poster

Jun 09 - 08:15 AM - 09:45 AM

Music Information Retrieval

Zafar Rafii, Minje Kim

Poster

Jun 09 - 08:15 AM - 09:45 AM

Deep Learning for Medical Image Segmentation

Ivan Bajic

Poster

Jun 09 - 08:15 AM - 09:45 AM

Detection and Classification in Medical Imaging

Jong Chul Ye

Oral

Jun 09 - 08:15 AM - 09:45 AM

Computational Imaging I

Hassan Mansour

Challenge

Jun 09 - 08:15 AM - 09:45 AM

ICASSP SP Clarity Challenge: Speech Enhancement for Hearing Aids

Oral

Jun 09 - 08:15 AM - 09:45 AM

Image and Video Enhancement

Akisato Kimura, Anastasios Drosou

Poster

Jun 09 - 08:15 AM - 09:45 AM

Image Coding/Compression

Andre Kaup, Yuan Li

Oral

Jun 09 - 08:15 AM - 09:45 AM

Graph based Learning I

Tommy Sonne Alstrom, Jhony Giraldo

Oral

Jun 09 - 08:15 AM - 09:45 AM

Multimodal Signal Processing and Analysis II

Theodoros Giannakopoulos

Poster

Jun 09 - 08:15 AM - 09:45 AM

Audio-Visual Signal Processing and Analysis

Emre Eskimez

Poster

Jun 09 - 08:15 AM - 09:45 AM

Multimodal Signal Processing and Analysis III

Antonio Pinheiro

Oral

Jun 09 - 08:15 AM - 09:45 AM

Speech recognition- training/adaptation

Bo Li, George Saon

Poster

Jun 09 - 08:15 AM - 09:45 AM

Speech Recognition: Modeling and Context

Wei Zhou

Poster

Jun 09 - 08:15 AM - 09:45 AM

Speech Recognition: Self-Supervised Models

Yifan Gong

Poster

Jun 09 - 08:15 AM - 09:45 AM

Various Aspects In Speech and Language Processing

Constantine Kotropoulos

Oral

Jun 09 - 08:15 AM - 09:45 AM

Decentralized Wireless Systems and Energy Harvesting

Namrata Vaswani

Poster

Jun 09 - 08:15 AM - 09:45 AM

Channel State Estimation

Kfir Cohen

Poster

Jun 09 - 08:15 AM - 09:45 AM

Signal processing over graphs and networks

Selin Aviyente, Hoi-To Wai

Poster

Jun 09 - 08:15 AM - 09:45 AM

Signal Processing Over Networks II

Sergio Barbarossa, Stefan Vlaski

Oral

Jun 09 - 08:15 AM - 09:45 AM

Robust Learning and Inference

Shaofeng Zou

Short Course

Jun 09 - 09:00 AM - 12:00 PM

Short Course

Jun 09 - 09:00 AM - 12:00 PM

Plenary

Jun 09 - 09:45 AM - 10:45 AM

Oral

Jun 09 - 10:50 AM - 12:20 PM

Applications to Vision, Speech, and Robotics

Brian Telfer

Poster

Jun 09 - 10:50 AM - 12:20 PM

Multimodal Learning

Nikolaos Mitiadonoudos

Challenge

Jun 09 - 10:50 AM - 12:20 PM

Person Identification and Relapse Detection from Continuous Recordings of Biosignals

Oral

Jun 09 - 10:50 AM - 12:20 PM

Adversarial Machine Learning

Marc Chaumont, Fernando Perez-Gonzalez

Oral

Jun 09 - 10:50 AM - 12:20 PM

Vision and Language Model

Jie Wu, Tao Mei

Poster

Jun 09 - 10:50 AM - 12:20 PM

Video Coding/Compression

Antonio Ortega, Feng Jiang

Poster

Jun 09 - 10:50 AM - 12:20 PM

Object Tracking

Shunli Zhang, Wenjing Yang

Poster

Jun 09 - 10:50 AM - 12:20 PM

Image Generation

Junliang Xing, Nicu Sebe

Oral

Jun 09 - 10:50 AM - 12:20 PM

Transfer Learning I

Thuan Nguyen, Hui Wang

Oral

Jun 09 - 10:50 AM - 12:20 PM

TTS: AM and Vocoder I

Tomoki Toda, Nicolas Obin

Poster

Jun 09 - 10:50 AM - 12:20 PM

Spoken Language Understanding

Patrick Nguyen

Poster

Jun 09 - 10:50 AM - 12:20 PM

Optimization and Machine Learning for Communications

Nir Shlezinger

Oral

Jun 09 - 10:50 AM - 12:20 PM

Signal Processing Education

Junichi Yamagishi

Poster

Jun 09 - 10:50 AM - 12:20 PM

Poster

Jun 09 - 10:50 AM - 12:20 PM

Sparse/low-dimensional signal processing

Masahiro Yukawa, Julien Flamant

Poster

Jun 09 - 10:50 AM - 12:20 PM

Signal Processing Theory and Methods I

David Tay, Tareq Al-Naffouri

Oral

Jun 09 - 10:50 AM - 12:20 PM

Signal Processing and Systems for Remote Biometrics

Yu Rong

Oral

Jun 09 - 10:50 AM - 12:20 PM

Signal Processing for RIS-Enabled Smart Wireless Environments

George Alexandropoulos

Poster

Jun 09 - 10:50 AM - 12:20 PM

Radar/Array Signal Processing. Networks and Communications

Shunqiao Sun, Peter Vouras, Brian Sadler

Poster

Jun 09 - 02:00 PM - 03:30 PM

Self-Supervised Learning and Data-Efficiency for Speech and Audio

Minje Kim

Poster

Jun 09 - 02:00 PM - 03:30 PM

Sound Event Detection and Localization; Bioacoustic Event Detection

Michael Mandel, Annamaria Mesaros

Oral

Jun 09 - 02:00 PM - 03:30 PM

Applications to Communications

Akihiko Sugiyama

Challenge

Jun 09 - 02:00 PM - 03:30 PM

The First Pathloss Radio Map Prediction Challenge

Oral

Jun 09 - 02:00 PM - 03:30 PM

Human Video Generation and Editing

Shiliang Pu, Junping Zhang

Oral

Jun 09 - 02:00 PM - 03:30 PM

Point Cloud Processing

Fu Lee Wang, Xudong Jiang

Poster

Jun 09 - 02:00 PM - 03:30 PM

Aspects in Machine Learning

Chun Yuan, Xinbo Gao

Poster

Jun 09 - 02:00 PM - 03:30 PM

Aspects in Image/Video Processing and Analysis

Deep Feature Aggregation for Lightweight Single Image Super-Resolution
Yanchun Li, Xinan He, Shujuan Tian, Zhetao Li, Saiqin Long
Stochastic super-resolution for Gaussian textures
Emile Pierret, Bruno Galerne
COLOR GUIDED DEPTH MAP SUPER-RESOLUTION WITH NONLOCLA AUTOREGRESSIVE MODELING
Wei Xu, Na Qi, Qing Zhu, Jingzhong Qi, Longlu Huang, Kun Cao, Yuxin Bao, Qianwen Wang
Classification-based Dynamic Network for Efficient Super-Resolution
Qi Wang, Weiwei Fang, Meng Wang, Yusong Cheng
M2TSR: Multi-range and Mix-grained Transformer for Single Image Super-Resolution
Zhong-Han Niu, Qinglong Zhang, Yi Fan, Yu-Bin Yang
A highly Interpretable Deep equilibrium network for hyperspectral image deconvolution
Alexandros Gkillas, Dimitris Ampeliotis, Kostas Berberidis
PoGaIN: Poisson-Gaussian Image Noise Modeling From Paired Samples
Nicolas L Bähler, Majed El Helou, Kaan Okumuş, Étienne Objois, Sabine Süsstrunk
IMAGE COMPLETION VIA DUAL-PATH COOPERATIVE FILTERING
Pourya Shamsolmoali, Masoumeh Zareapoor, Eric Granger
Hyneter: Hybrid Network Transformer for Object Detection
Dong Chen, duoqian miao, Xuerong Zhao
Trainable Subspaces for Low Rank Tensor Completion: Model and Analysis
Zhen Long, Ce Zhu, Jiani Liu, Pierre Comon, Yipeng Liu
SHADOW REMOVAL OF TEXT DOCUMENT IMAGES USING BACKGROUND ESTIMATION and ADAPTIVE TEXT ENHANCEMENT
Wenjie Liu, Bingshu Wang, Jiangbin Zheng, Wenmin Wang
ShaDocNet: Learning Spatial-Aware Tokens in Transformer for Document Shadow Removal
Xuhang Chen, Xiaodong Cun, Chi-Man Pun, Shuqiang Wang
Efficient ADMM-based Algorithms for Convolutional Sparse Coding
Farshad G Veshki, Sergiy Vorobyov
ISP Distillation
Eli Schwartz, Alex Bronstein, Raja Giryes
Self-Supervised Learning Based Anomaly Detection in Synthetic Aperture Radar Imaging
Max Muzeau, Chengfang Ren, Sebastien Angelliaume, Mihai Dactu, Jean-Philippe Ovarlez
BL-JUNIPER: A CNN-Assisted Framework for Perceptual Video Coding Leveraging Block-Level JND
Sanaz Nami, Farhad Pakdaman, Mahmoud R. Hashemi, Shervin Shirmohammadi
ESTIMATION OF VISUAL CONTENTS FROM HUMAN BRAIN SIGNALS VIA VQA BASED ON BRAIN-SPECIFIC ATTENTION
Ryo Shichida, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
Recallable Question Answering-based Re-ranking Considering Semantic Region for Cross-modal Retrieval
Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
SELF-DISTILLATION HASHING FOR EFFICIENT HAMMING SPACE RETRIEVAL
Hongjia HJ Zhai, Hai Li, hanzhi zhang, Hujun Bao, Guofeng Zhang

Bingbing Ni, Pan Zhou

Poster

Jun 09 - 02:00 PM - 03:30 PM

Learning Algorithms and Applications

Wenwu Wang, Paolo Bestagini

Poster

Jun 09 - 02:00 PM - 03:30 PM

Optimization Methods in Machine Learning

Jinsub Kim, Zai Yang

Poster

Jun 09 - 02:00 PM - 03:30 PM

Applications of Machine Learning

Chang D. Yoo, Robert Jenssen

Oral

Jun 09 - 02:00 PM - 03:30 PM

Multimedia Databases and Information Retrieval

Chi-Man Pun

Short Course

Jun 09 - 02:00 PM - 04:00 PM

Short Course

Jun 09 - 02:00 PM - 04:00 PM

Oral

Jun 09 - 02:00 PM - 03:30 PM

Voice and Style Conversion I

Berrak Sisman, Satoshi Nakamura

Poster

Jun 09 - 02:00 PM - 03:30 PM

TTS: AM and Vocoder II

Jan Skoglund

Poster

Jun 09 - 02:00 PM - 03:30 PM

Voice and Style Conversion II

ACE-VC: Adaptive and Controllable Voice Conversion using Explicitly Disentangled Self-supervised Speech Representations
Shehzeen S Hussain, Paarth Neekhara, Jocelyn Huang, Jason Li, Boris Ginsburg
DELIVERING SPEAKING STYLE IN LOW-RESOURCE VOICE CONVERSION WITH MULTI-FACTOR CONSTRAINTS
Zhichao Wang, Xinsheng Wang, Lei Xie, yuanzhe chen, qiao tian, wang yuping
Improving Prosody for Cross-Speaker Style Transfer by Semi-Supervised Style Extractor and Hierarchical Modeling in Speech Synthesis
Chunyu Qiang, Peng Yang, Hao Che, Ying Zhang, Xiaorui Wang, Zhongyuan Wang
Streaming Voice Conversion Via Intermediate Bottleneck Features And Non-streaming Teacher Guidance
yuanzhe chen, Ming Tu, Tang Li, Xin Li, Qiuqiang Kong, Jiaxin Li, Zhichao Wang, qiao tian, wang yuping, Yuxuan Wang
Do Prosody Transfer Models Transfer Prosody?
Atli Thor Sigurgeirsson, Simon King
LIMI-VC: A LIGHT WEIGHT VOICE CONVERSION MODEL WITH MUTUAL INFORMATION DISENTANGLEMENT
Liangjie Huang, Tian Yuan, Yunming Liang, Zeyu Chen, Can Wen, Yanlu Xie, Jinsong Zhang, dengfeng ke
NONPARALLEL EMOTIONAL VOICE CONVERSION FOR UNSEEN SPEAKER-EMOTION PAIRS USING DUAL DOMAIN ADVERSARIAL NETWORK & VIRTUAL DOMAIN PAIRING
Nirmesh J Shah, Mayank Kumar Singh, Naoya Takahashi, Naoyuki Onoe
Hiding speaker's sex in speech using zero-evidence speaker representation in an analysis/synthesis pipeline
Paul-Gauthier Noé, Xiaoxiao Miao, Xin Wang, Junichi Yamagishi, Jean-Francois Bonastre, Driss Matrouf
DVQVC: AN UNSUPERVISED ZERO-SHOT VOICE CONVERSION FRAMEWORK
Dayong Li, xian li, Xiaofei Li
VQ-CL: Learning disentangled speech representations with contrastive learning and vector quantization
Huaizhen Tang, Xulong Zhang, Jianzong Wang, Ning Cheng, Jing Xiao, Ping An Insurance
ANY-TO-ANY VOICE CONVERSION WITH F0 AND TIMBRE DISENTANGLEMENT AND NOVEL TIMBRE CONDITIONING
Sudheer Kumar Kovela, Rafael Valle, Ambrish Dantrey, Bryan Catanzaro
A Comparative Study of Self-Supervised Speech Representation Based Voice Conversion
Wen-Chin Huang, Shu-wen Yang, Tomoki Hayashi, Tomoki Toda

Rui Liu

Poster

Jun 09 - 02:00 PM - 03:30 PM

Sensing, Computing, and Semantic Communications

Apoorva Chawla

Poster

Jun 09 - 02:00 PM - 03:30 PM

Sparsity and Low-Rank Models

Georgios Giannakis, Arnaud Breloy

Poster

Jun 09 - 02:00 PM - 03:30 PM

Signal Processing Over Graphs

Antonio Ortega, Antonio Marques

Oral

Jun 09 - 02:00 PM - 03:30 PM

Synergy between human and machine approaches to sound/scene recognition and processing

Benjamin Elizalde

Oral

Jun 09 - 02:00 PM - 03:30 PM

Topological and Simplicial Data Processing

Santiago Segarra, Elvin Isufi

Oral

Jun 09 - 02:00 PM - 03:30 PM

Unsupervised Deep Learning of Image Priors for Inverse Problems

Bihan Wen

Oral

Jun 09 - 03:35 PM - 05:05 PM

Target Source Extraction

Nobutaka Ito, Gordon Wichern

Oral

Jun 09 - 03:35 PM - 05:05 PM

Music Generation and Arrangement

Juan Pablo Bello, Kyogu Lee

Poster

Jun 09 - 03:35 PM - 05:05 PM

Spatial Audio Recording and Reproduction

Mark Thomas

Poster

Jun 09 - 03:35 PM - 05:05 PM

Speech Modeling and Audio Coding

Jan Skoglund

Poster

Jun 09 - 03:35 PM - 05:05 PM

Audio Processing and Analysis

Constantine Kotropoulos

Poster

Jun 09 - 03:35 PM - 05:05 PM

Physiological Signal Processing II

Richard Hendricks

Poster

Jun 09 - 03:35 PM - 05:05 PM

Computational Imaging IV

Salman Asif

Challenge

Jun 09 - 03:35 PM - 05:05 PM

Multimodal Information Based Speech Processing (MISP) 2022 Challenge Proposal

Oral

Jun 09 - 03:35 PM - 05:05 PM

Image Retrieval and Classification

Hujun Bao, Juan Liu

Poster

Jun 09 - 03:35 PM - 05:05 PM

Image/Video Enhancement

Yu-Chiang Frank, Yao Zhao

Oral

Jun 09 - 03:35 PM - 05:05 PM

Adversarial Machine Learning I

Sijia Liu, Alfred Hero

Poster

Jun 09 - 03:35 PM - 05:05 PM

Zero or Few Shot Learning

Zheng-Hua Tan

Poster

Jun 09 - 03:35 PM - 05:05 PM

Acoustic and Microphone Array Processing

Florian Meyer, Nilesh Madhu

Poster

Jun 09 - 03:35 PM - 05:05 PM

Speech and Language Disorders

``Prediction of Sleepiness Ratings from Voice by Man and Machine": a perceptual experiment replication study
Vincent P. Martin, Aymeric Ferron, Jean-Luc Rouas, Pierre Philip
Self-supervised representations in speech-based depression detection
Wen Wu, Chao Zhang, Phil Woodland
Towards Reducing Patient Effort for the Automatic Prediction of Speech Intelligibility in Head and Neck Cancers
Sebastião Quintas, Alberto Abad, Julie Mauclair, Virginie Woisard, Julien Pinquier
A Context-Aware Computational Approach for Measuring Vocal Entrainment in Dyadic Conversations
Rimita Lahiri, Md Nasir, Catherine Lord, So Hyun Kim, Shrikanth Narayanan
Feature Selection and Text Embedding For Detecting Dementia from Spontaneous Cantonese
Xiaoquan Ke, Man-Wai MAK, Mei Ling MENG
A knowledge-driven vowel-based approach of depression classification from speech using data augmentation
Kexin Feng, Theodora Chaspari
NEURAL ARCHITECTURE SEARCH WITH MULTIMODAL FUSION METHODS FOR DIAGNOSING DEMENTIA
Michail Chatzianastasis, Loukas Ilias, Dimitris Askounis, Michalis Vazirgiannis
EARLY DETECTION OF COGNITIVE DECLINE USING VOICE ASSISTANT COMMANDS
Eli Kurtz, Youxiang Zhu, Tiffany Driesse, Bang Tran, John Batsis, Robert Roth, Xiaohui Liang
EXPLORING THE ROLE OF FRICATIVES IN CLASSIFYING HEALTHY SUBJECTS AND PATIENTS WITH AMYOTROPHIC LATERAL SCLEROSIS AND PARKINSON’S DISEASE
Tanuka Bhattacharjee, Yamini BK, Nalini Atchayaram, Ravi Yadav, Prasanta Dr Ghosh
STATIC AND DYNAMIC SOURCE AND FILTER CUES FOR CLASSIFICATION OF AMYOTROPHIC LATERAL SCLEROSIS PATIENTS AND HEALTHY SUBJECTS
Tanuka Bhattacharjee, Chowdam Venkata Thirumala Kumar, Yamini BK, Nalini Atchayaram, Ravi Yadav, Prasanta Dr Ghosh, IISc, Bangalore
Tranferring Quantified Emotion Knowledge for the Detection of Depression in Alzheimer's Disease Using ForestNets
Paula Andrea Pérez-Toro, Dalia Rodríguez-Salas, Tomas Arias-Vergara, Sebastian P Bayerl, Philipp Klumpp, Korbinian Riedhammer, Maria Schuster, Elmar Noeth, Andreas K Maier, Juan Rafael Orozco-Arroyave
Leveraging Pretrained Representations with Task-related Keywords for Alzheimer's Disease Detection
Jinchao Li, Kaitao Song, Junan Li, Bo ZHENG, Dongsheng Li, Xixin Wu, Xunying Liu, Helen Meng

Milos Cernak

Poster

Jun 09 - 03:35 PM - 05:05 PM

Various Aspects in Speech and Speaker Recognition

Shri Narayanan

Oral

Jun 09 - 03:35 PM - 05:05 PM

Signal Processing Over Networks I

Abdelhak Zoubir, Visa Koivunen

Poster

Jun 09 - 03:35 PM - 05:05 PM

Signal Processing Theory and Methods II

Athina Petropulu

Poster

Jun 09 - 03:35 PM - 05:05 PM

Sampling Theory, Compressed and Non-uniform Sampling

Yonina Eldar, Ayush Bhandari

Oral

Jun 09 - 03:35 PM - 05:05 PM

Variational Inference and Approximate Bayesian Techniques

Dirk Slock

General

Jun 09 - 05:15 PM - 06:15 PM

Social

Jun 09 - 09:00 PM - 12:00 AM

Workshop

Jun 10 - 08:30 AM - 05:30 PM

SLTAT 2023: Eighth International Workshop on Sign Language Translation and Avatar Technology

Querying a Sign Language Dictionary with Videos using Dense Vector Search
Mathieu De Coster, Joni Dambre
Machine Translation to Sign Language using Post-translation Replacement without Placeholders
Taro Miyazaki, Naoki Nakatani, Tsubasa Uchida, Hiroyuki Kaneko, Masanori Sano
Recognizing Highly Variable American Sign Language in Virtual Reality
Md Shahinur Alam, Myles Bastion, Melissa Malzkuhn, Lorna Quandt
A Method for Generating a Non-Manual Feature Model for Sign Language Processing
Robert Smith, Markus Hofmann
Motion Editing Tool for Reproducing Grammatical Elements of Japanese Sign Language Avatar Animation
Tsubasa Uchida, Naoki Nakatani, Taro Miyazaki, Hiroyuki Kaneko, Masanori Sano
Representation Matters: The Case for Diversifying Sign Language Avatars
Maria Kopf, Rehana Omardeen, Davy Van Landuyt
Asymmetry in Transition Times in American Sign Language
Nicole Barnekow, Meaghan Lidd, Deannia Lucas, John McDonald
Sign Language Avatar Animation Search: an Ani2Ani Search Application
Mathew J Huerta-Enochian, Changyong Ko
Leveraging Large Language Models with Vocabulary Sharing for Sign Language Translation
Huije Lee, Jung-Ho Kim, Eui Jun Hwang, Jaewoo Kim, Jong Park
Improving 3D Pose Estimation for Sign Language
Maksym Ivashechkin, Oscar Mendez, Richard Bowden
Automatic Alignment between Sign Language Videos and Motion Capture Data: A Motion Energy-Based Approach
Fabrizio Nunnari, Mina Ameli, Shailesh Mishra
Gloss Alignment Using Word Embeddings
Harry Walsh, Ozge Mercanoglu Sincan, Ben Saunders, Richard Bowden
ISOLATED KOREAN SIGN GLOSS RECOGNITION: THE PHONOLOGICAL BASE
Hyun Lee, Han--kyu Lee, Chung Hyun Ahn, Wonjae Lee
Distractor-based Evaluation of Sign Spotting
Natalie Hollain, Martha Larson, Floris Roelofsen
Towards Incorporating 3D Space-Awareness into an Augmented Reality Sign Language Interpreter
Fabrizio Nunnari, Eleftherios Avramidis, Vemburaj Chockalingam Yadav, Alain Pagani, Yasser Hamidullah, Sepideh Mollanorozy, Cristina España_i_Bonet, Emil Woop, Patrick Gebhard
The Sign Language Interchange Format: Harmonising Sign Language Datasets for Computational Processing
Marc Schulder, Sam Bigeard, Thomas Hanke, Maria Kopf
EASIER Notation – A Proposal for a Gloss-based Scripting Language for Sign Language Generation Based on Lexical Data
Thomas Hanke, Lutz König, Reiner Konrad, Maria Kopf, Marc Schulder, Rosalee J. Wolfe
Augmenting glosses with geometrical inflection parameters for the animation of sign language avatars
Fabrizio Nunnari, Mishra Shailesh, Patrick Gebhard
SL-REDU GSL: A LARGE GREEK SIGN LANGUAGE RECOGNITION CORPUS
Katerina Papadimitriou, Galini Sapountzaki, Kyriaki Vasilaki, Eleni Efthimiou, Stavroula-Evita Fotinea, Gerasimos Potamianos
Extending Morphs in AZee using Pose Space Deformations
Paritosh Sharma, Michael Filhol
TrueDepth measurements of facial expressions: Sensitivity to the angle between camera and face
Lyke Esselink, Marloes Oomen, Floris Roelofsen
DO PREDICTABILITY FACTORS TOWARDS SIGNING AVATARS HOLD ACROSS CULTURES?
Abdelhadi Soudi, manal El hakkaoui, Kristof Van Laerhoven
When (shared) space and time don’t matter. Remote video-mediated (synchronous and asynchronous) communication in Flemish Sign Language.
Lien Soetemans, Myriam Vermeerbergen
A Text-to-SL Translation System using 3D Avatar Technology
Sylvie Gibet

Workshop

Jun 10 - 08:30 AM - 12:00 PM

SASB 2023: Self-Supervision in Audio, Speech and Beyond

Specialized semantic enrichment of speech representations
Gaëlle Laperrière, Ha Nguyen, Sahar ghannay, Bassam Jabaian, Yannick Estève
Self-supervised audio encoder with contrastive pretraining for Respiratory Anomaly Detection
Shubham Kulkarni, Hideaki Watanabe, Fuminori Homma
CHAPTER: Exploiting Convolutional Neural Network Adapters for Self-supervised Speech Models
Zih-Ching Chen, Yu-Shun Sung, Hung-yi Lee
Zero-shot text-to-speech synthesis conditioned using self-supervised speech representation model
Kenichi Fujita, Takanori Ashihara, Hiroki Kanagawa, Takafumi Moriya, Yusuke Ijima
A Reference-less Quality Metric for Automatic Speech Recognition via Contrastive-Learning of a Multi-Language Model with Self-Supervision
Kamer Yuksel, Thiago Ferreira, Ahmet Gündüz, Mohamed Elbadrashiny, Golara Javadi
Phone and speaker spatial organization in self-supervised speech representations
Pablo Riera, Manuela Cerdeiro, Leonardo D Pepino, Luciana Ferrer
Efficient Utilization of Large Pre-Trained Models for Low Resource ASR
Peter Vieting, Christoph Lüscher, Julian Dierkes, Ralf Schlüter, Hermann Ney
AudioSlots: A slot-centric generative model for audio separation
Pradyumna Reddy, Scott Wisdom, Klaus Greff, John Hershey, Thomas Kipf
Fine-tuning Strategies for Faster Inference using Speech Self-Supervised Models : A Comparative Study
Salah Zaiem, Robin Algayres, Titouan Parcollet, Slim Essid, Mirco Ravanelli
Measuring the Impact of Domain Factors in Self-Supervised Pre-Training
Ramon S Sanabria, Wei-Ning Hsu, Alexei Baevski, Michael Auli
Deep Investigation of Intermediate Representations in Self-Supervised Learning Models for Speech Emotion Recognition
Zhi Zhu, Yoshinao Sato
A vector quantized masked autoencoder for speech emotion recognition
Samir Sadok, Simon Leglaive, Renaud SEGUIER
Self-supervised learning for infant cry analysis
Arsenii Gorin, Cem Subakan, Sajjad Abdoli, Junhao Wang, Samantha Latremouille, Charles Onu
A COMPARATIVE STUDY OF SELF-SUPERVISED SPEECH REPRESENTATIONS IN READ AND SPONTANEOUS TTS
Siyang Wang, Gustav Eje Henter, Joakim Gustafson, Eva Szekely
Pac-HuBERT: Self-Supervised Music Source Separation via Primitive Auditory Clustering and Hidden-Unit BERT
Ke Chen, Gordon Wichern, François G Germain, Jonathan LeRoux
Improving Label-deficient Keyword Spotting Through Self-supervised Pretraining
Holger Bovbjerg, Zheng-Hua Tan
Improving DINO-based self-supervised speaker verification with progressive cluster-aware training
Bing Han, Wen Huang, Zhengyang Chen, Yanmin Qian
UNFUSED : UNsupervised Finetuning Using SElf supervised Distillation
Ashish Seth, Sreyan Ghosh, S Umesh, Dinesh Manocha
Investigation of the quality of pseudo-labels for the self-supervised speaker verification task
Abderrahim Fathan, Jahangir Alam, woohyun kang
Channel-Aware Pretraining of Joint Encoder-Decoder Self-Supervised Model for Telephonic-Speech ASR
Vrunda Sukhadia, S Umesh

Workshop

Jun 10 - 08:30 AM - 05:30 PM

Workshop on Signal Processing for Synthetic Apertures

Synthetic Aperture RF Reception using Rydberg Atoms
Nikunjkumar Prajapati, Alexandra Artusio-Glimpse, Matthew Simons, Samuel Berweger, Andrew Rotunno, Maitreyi Jayaseelan, Kaleb Campbell, Christopher Holloway
Towards Rydberg atom synthetic apertures: Wide-area high-resolution RF amplitude and phase imaging with Rydberg probes
David Anderson, Luis Goncalves, Remy Legaie, Georg Raithel
Joint Waveform and Wavefront Engineering for Terahertz Communications in 6G
Duschia Bodet, Josep Jornet
DEEP DENOISING PRIOR-BASED SPECTRAL ESTIMATION FOR PHASELESS SYNTHETIC APERTURE RADAR
Samia Kazemi, Bariscan Yonel, Birsen Yazici
Fast Cauchy-Rician Modelling of SAR Images with Method of Algebraic Moments Estimator
Mutong LI, Ercan E Kuruoglu
Row-Column Beamformer for Fast Volumetric Imaging
Lasse Thurmann Jørgensen, Sebastian Præsius, Nathalie Panduro, Sofie Andersen, Charlotte Sørensen, Jørgen Jensen
SCOPING A DOCUMENT ON RECOMMENDED PRACTICES FOR SYNTHETIC APERTURE RADIOMETRY
Brian Sequeira, Corina Nafornita
Federated Multi-Task Learning for THz Wideband Channel and DoA Estimation
Ahmet M Elbir, Wei Shi, Kumar Vijay Mishra, Symeon Chatzinotas
AN IMPROVED AUTOFOCUS ALGORITHM WITH BAYESIAN TRACKING OF RESIDUAL MOTION FOR AUTOMOTIVE MIMO-SAR IMAGING
Gabriele Balducci, Marco Manzoni, Stefano Tebaldini, Andrea Virgilio Monti-Guarnieri, Claudio Maria Prati, Ivan Russo
Speeding Up Detection and Imaging Using Quantum Radars
David Luong, Bhashyam Balaji, Sreeraman Rajan
Bistatic MIMO Radar Sensing of Specularly Reflecting Surfaces for Wireless Power Transfer
Benjamin J. B. Deutschmann, Maximilian Graber, Thomas Wilding, Klaus Witrisal
Satellite-to-satellite linear array SAR 3D backward projection super-resolution imaging algorithm with compressed sensing
Zhexian Liu, Shuai Shao, Hongwei Liu
Synthetic aperture sonar micronavigation with variational inference of a state-space model
Angeliki Xenaki, Yan Pailhas, Alessandro Monti
EXPLOITATION OF SINGLE-CHANNEL SPACE-BORNE SAR DATA FOR SHIP TARGETS IMAGING AND MOTION PARAMETERS ESTIMATION
Alejandro Testa, Debora Pastina, Massimo Zavagli, Fabrizio Santi, Chiara Pratola, Michela Corvino
ALONG TRACK SLOPE COMPENSATION IN A SIMO FORMATION
Naomi Petrushevsky, Andrea Monti-Guarnieri
A UNIFIED SEMANTIC SEGMENTATION AND OBJECT DETECTION FRAMEWORK FOR SYNTHETIC APERTURE SONAR IMAGERY
Shannon-Morgan Steele
Stochastic Deep Image Prior for Multishot Compressive Spectral Image Fusion
Roman A Jacome, Brayan Monroy, Jorge Bacca, Henry Arguello
Two-Step Adaptive Anti-Mainlobe-Jamming Processing for polarimetric Conformal Arrays
Wanpeng Huang, Jinyang He, Ziyang Cheng, Zishu He
Implicit Channel Learning for Machine Learning Applications in 6G Wireless Networks
Ahmet M Elbir, Wei Shi, Kumar Vijay Mishra, Anastasios Papazafeiropoulos, Symeon Chatzinotas

Workshop

Jun 10 - 08:30 AM - 05:30 PM

Timely and Private Machine Learning over Networks

Workshop

Jun 10 - 08:30 AM - 12:00 PM

AI-Enabled Medical Image Analysis Workshop and COVID-19 Diagnosis Competition (AI-MIA-COV19D)

DEEP CONVOLUTIONAL NEURAL NETWORKS WITH TRANSFER LEARNING FOR BONE FRACTURE RECOGNITION USING SMALL EXEMPLAR IMAGE DATASETS
Nikhil Kethu Kumar Reddy, Vassilis Cutsuridis
Adversarial Attacks & Detection on a Deep Learning-based Digital Pathology Model
Eleanna Vali, Georgios Alexandridis, Andreas Stafylopatis
MIA-3DCNN: A 3D Convolutional Neural Network for COVID-19 Detection and Severity Classification
Igor Nakashima, Giovanna Vendramini, Helio Pedrini
Deep-Covid-Sev: An Ensemble 2D and 3D CNN-Based approach for COVID-19 Severity Prediction From 3D CT-Scans
Fares Bougourzi, Fadi Dornaika, amir nakib, Cosimo Distante, Abdelmalik Taleb-Ahmed
Ensemble Methods for Enhanced COVID-19 CT scan severity analysis
Anand Thyagachandran, Hema A Murthy
DATA-DRIVEN COVID-19 DETECTION THROUGH MEDICAL IMAGING
Anastasis Arsenos, Andjoli Davidhi, Dimitrios Kollias, Panos Prassopoulos, Stefanos Kollias
AI-ENABLED ANALYSIS OF 3-D CT SCANS FOR DIAGNOSIS OF COVID-19 & ITS SEVERITY
Dimitrios Kollias, Anastasis Arsenos, Stefanos Kollias
Attention-Based Convolutional Neural Network for CT Scan COVID-19 Detection
Alessia Rondinella, Francesco Guarnera, Oliver Giudice, Alessandro Ortis, Francesco Rundo, Sebastiano Battiato
Bag of Tricks of Hybrid Network for COVID-19 Detection of CT Scans
Chih-Chung Hsu, Chih-Yu Jian, Chia-Ming Lee, Chi-Han Tsai, Shen Chieh Tai
Color Deconvolution applied to Domain Adaptation in HER2 histopathological images
David Anglada-Rotger, Ferran Marques, Montse Pardas
GLOVE-ING ATTENTION: A MULTI-MODAL NEURAL LEARNING APPROACH TO IMAGE CAPTIONING
Lars Halvor Anundskås, Hina Afridi, Adane N. Tarekegn, Muhammad Mudassar Yamin, Mohib Ullah, Saira Yamin, Faouzi Alaya-Chekh
ALL-IDB PATCHES: WHOLE SLIDE IMAGING FOR ACUTE LYMPHOBLASTIC LEUKEMIA DETECTION USING DEEP LEARNING
Angelo Genovese, Vincenzo Piuri, fabio scotti
COVID-19 DETECTION FROM X-RAYS IMAGES USING DEEP LEARNING METHODS
GEORGIOS SAPOUNTZAKIS, Paraskevi-Antonia Theofilou, Paraskevi Tzouveli
Lung segmentation enhances COVID-19 Detection
Robert B Turnbull

Workshop

Jun 10 - 08:30 AM - 12:00 PM

6G-USGIC: 6G Ubiquitous Space Ground Integrated Communications

Workshop

Jun 10 - 02:00 PM - 05:30 PM

Ambient AI: Multimodal Wearable Sensor Understanding

A CRNN-GCN Piano Transcription Model Based on Audio and Skeleton Features
Yuqing Li, Xianke Wang, Ruimin Wu, Wei Xu, Wenqing Cheng
A Dataset for Foreground Speech Analysis with Smartwatches in Everyday Home Environments
Dawei Liang, Zifan Xu, Yinuo Chen, Rebecca Adaimi, David Harwath, Edison Thomaz
HUMAN ACTIVITY RECOGNITION FROM MOTION AND ACOUSTIC SENSORS USING CONTRASTIVE LEARNING
Rui Zhou, Running Zhao, Edith Ngai
A Health Profiling Framework for Children Leveraging Multimodal Learning Based on Ambient Sensor Signals
Zhihan JIANG, Cong Xie, Edith Ngai
Ambient Sleep Quality Analysis with A Machine Learning Model
Mehmet F Bagci, Truong Nguyen, Yusuf OZTURK
Multimodal Estimation of Change Points of Physiological Arousal during Driving
Kleanthis Avramidis, Tiantian Feng, Digbalay Bose, Shrikanth Narayanan
AI-Toolkit: a Microservices Architecture for Low-Code Decentralized Machine Intelligence
Vincenzo Lomonaco, Valerio De Caro, Claudio Gallicchio, Antonio Carta, Christos Sardianos, Iraklis Varlamis, Konstantinos Tserpes, Massimo Coppola, Mina Marpena, Sevasti Politi, Erwin Schoitsch, Davide Bacciu
Smart Selection of Useful Insights from Wearables
Allmin Susaiyah, Aki Harma, Simone Balloccu, Ehud Reiter, Milan Petkovic
ENHANCING HUMAN ACTIVITY RECOGNITION THROUGH SENSOR FUSION AND HYBRID DEEP LEARNING MODEL
Adane N. Tarekegn, Mohib Ullah, Faouzi Alaya-Chekh, Muhammad Sajjad
DEVELOPMENT OF A PAIN SIGNALING SYSTEM USING MACHINE LEARNING
Helen Korving, Di Zhou, Sheng Li, Paula Sterkenburg, Panos Markopoulos, Emilia Barakova
Prediction of Driver's Stress Affection in Simulated Autonomous Driving Scenarios
Valerio De Caro, Herbert Danzinger, Claudio Gallicchio, Clemens Könczöl, Vincenzo Lomonaco, Mina Marmpena, Sevasti Politi, Omar Veledar, Davide Bacciu
Symbiotic Artificial Intelligence: Order Picking and Ambient Sensing
Zhe Ming Chng, Calix Tang, Darshan Krishnaswamy, Haoyang Yang, Shivang Chopra, Jon Womack, Thad Starner
A SURVEY OF DATASETS, APPLICATIONS, AND MODELS FOR IMU SENSOR SIGNALS
Aparajita Saraf, Seungwhan Moon, Andrea Madotto

Workshop

Jun 10 - 02:00 PM - 05:30 PM

AMHAT 2023: Advances in Multimodal Hearing Assistive Technologies