librosa
numpy
soundfile
torch
transformers