OliBomby
/

CM3P

Feature Extraction

Model card Files Files and versions

OliBomby commited on Nov 23, 2025

Commit

7b6f0a8

·

verified ·

1 Parent(s): 88986bc

Add CM3P model

Files changed (1) hide show

processing_cm3p.py +3 -2

processing_cm3p.py CHANGED Viewed

@@ -135,6 +135,7 @@ class CM3PTokenizerKwargs(TypedDict, total=False):
 class CM3PBeatmapKwargs(CM3PTokenizerKwargs, total=False):
     window_length_sec: float
     window_stride_sec: float
 class CM3PAudioKwargs(AudioKwargs, total=False):
@@ -563,7 +564,7 @@ class CM3PProcessor(ProcessorMixin):
                     **beatmap_kwargs,
                 )
-                if audio is not None:
                     data = dict(beatmap_encoding)
                     data["input_features"] = self._retrieve_input_features(batch_audio, **audio_kwargs)
                     beatmap_encoding = BatchFeature(data, tensor_type=return_tensors)
@@ -577,7 +578,7 @@ class CM3PProcessor(ProcessorMixin):
                     },
                     tensor_type=return_tensors,
                 )
-                if audio is not None:
                     data = dict(beatmap_encoding)
                     data["input_features"] = torch.zeros((0, self.audio_feature_extractor.feature_size, max_source_positions), dtype=torch.float) if return_tensors == "pt" else []
                     beatmap_encoding = BatchFeature(data, tensor_type=return_tensors)

 class CM3PBeatmapKwargs(CM3PTokenizerKwargs, total=False):
     window_length_sec: float
     window_stride_sec: float
+    min_window_length_sec: float
 class CM3PAudioKwargs(AudioKwargs, total=False):
                     **beatmap_kwargs,
                 )
+                if all(a is not None for a in audio):
                     data = dict(beatmap_encoding)
                     data["input_features"] = self._retrieve_input_features(batch_audio, **audio_kwargs)
                     beatmap_encoding = BatchFeature(data, tensor_type=return_tensors)
                     },
                     tensor_type=return_tensors,
                 )
+                if all(a is not None for a in audio):
                     data = dict(beatmap_encoding)
                     data["input_features"] = torch.zeros((0, self.audio_feature_extractor.feature_size, max_source_positions), dtype=torch.float) if return_tensors == "pt" else []
                     beatmap_encoding = BatchFeature(data, tensor_type=return_tensors)