fix: peak-normalize separated sources

pyannote · Jun 21, 2024 · a766f2a · a766f2a
1 parent 2e04ec7
commit a766f2a
Showing 1 changed file with 6 additions and 0 deletions.
diff --git a/pyannote/audio/pipelines/speech_separation.py b/pyannote/audio/pipelines/speech_separation.py
@@ -654,6 +654,12 @@ def apply(
                 sources.data * discrete_diarization.align(sources).data[:, :num_sources]
             )
 
+        # separated sources might be scaled up/down due to SI-SDR loss used when training
+        # so we peak-normalize them
+        sources.data = sources.data / np.max(
+            np.abs(sources.data), axis=0, keepdims=True
+        )
+
         # convert to continuous diarization
         diarization = self.to_annotation(
             discrete_diarization,