Complex-bin2bin: A Latency-Flexible Generative Neural Model for Audio Packet Loss Concealment

Lo studio di questa settimana affronta il problema della perdita di dati nelle trasmissioni audio digitali.
Gli autori propongono un approccio innovativo, basato su reti neurali generative, per la ricostruzione delle porzioni di audio corrotte. Rispetto alle tecniche esistenti, la metodologia presentata offre una maggiore flessibilità operativa, consentendo di bilanciare velocità computazionale e qualità della ricostruzione.
L’efficacia del metodo è stata validata anche attraverso test soggettivi condotti da ascoltatori esperti. Alcuni esempi audio sono disponibili al seguente link: aircarlo.github.io/cplx_bin2bin/.

Il paper è disponibile al link: doi.org/10.1109/TASLP.2024.3515794