RicardoQi
/

Allofomer_ru

RicardoQi commited on Jul 5, 2025

Commit

e2d81c2

verified ·

1 Parent(s): 1befda4

Upload distilled conformer recognizer object and loader script

Files changed (2) hide show

modeling.py CHANGED Viewed

@@ -46,17 +46,17 @@ class UpgradedRecognizer:
             waveform = resampler(waveform)
         if waveform.shape[0] > 1:
             waveform = torch.mean(waveform, dim=0, keepdim=True)
         audio_object = Audio(waveform.squeeze().cpu().numpy(), 16000)
         features = self.pm.compute(audio_object)
         features_tensor = torch.tensor(features).unsqueeze(0).to(self.device)
         lengths_tensor = torch.tensor([features_tensor.shape[1]], device=self.device)
         with torch.no_grad():
             logits = self.am(features_tensor, lengths_tensor)
         logits_numpy = logits.squeeze(0).cpu().numpy()
         phoneme_list = self.lm.compute(logits_numpy, lang_id='ipa', topk=1)
         return " ".join(phoneme_list)

             waveform = resampler(waveform)
         if waveform.shape[0] > 1:
             waveform = torch.mean(waveform, dim=0, keepdim=True)
         audio_object = Audio(waveform.squeeze().cpu().numpy(), 16000)
         features = self.pm.compute(audio_object)
         features_tensor = torch.tensor(features).unsqueeze(0).to(self.device)
         lengths_tensor = torch.tensor([features_tensor.shape[1]], device=self.device)
         with torch.no_grad():
             logits = self.am(features_tensor, lengths_tensor)
         logits_numpy = logits.squeeze(0).cpu().numpy()
         phoneme_list = self.lm.compute(logits_numpy, lang_id='ipa', topk=1)
         return " ".join(phoneme_list)

recognizer.dill CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8b7fe6beee958af085db2ceb6fe6c30b1666a48ca8b710ef6bcdbea2e20faf5a
-size 190360911

 version https://git-lfs.github.com/spec/v1
+oid sha256:27490f914a4e5a4484f59e8a78c5e3291fb3a170a76cfb68c1ffaff05c12b0fc
+size 190360330