Spaces:

mnhatdaous
/

learnable-speech

Sleeping

primepake commited on Jul 20

Commit

34bf06f

1 Parent(s): f768eb3

update train with learnable encoder

Files changed (1) hide show

speech/cosyvoice/flow/flow.py CHANGED Viewed

@@ -346,7 +346,7 @@ class CausalMaskedDiffWithXvec(torch.nn.Module):
                         mask = batch['reference_mel_masks'][:, i, :].unsqueeze(1).to(device)
                     else:
                         mask = None
-                    print('ref_mel mask: ', ref_mel.shape, mask.shape)
                     # Apply speaker encoder
                     with torch.set_grad_enabled(not self.freeze_speaker_encoder):
                         emb = self.speaker_encoder(ref_mel, mask)  # [B, spk_embed_dim]

                         mask = batch['reference_mel_masks'][:, i, :].unsqueeze(1).to(device)
                     else:
                         mask = None
+                    # print('ref_mel mask: ', ref_mel.shape, mask.shape)
                     # Apply speaker encoder
                     with torch.set_grad_enabled(not self.freeze_speaker_encoder):
                         emb = self.speaker_encoder(ref_mel, mask)  # [B, spk_embed_dim]