umarigan
/

speecht5_tts_tr_v1.0

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

umarigan commited on Sep 23, 2024

Commit

126bbce

·

verified ·

1 Parent(s): f8e9db1

Update README.md

Files changed (1) hide show

README.md +9 -3

README.md CHANGED Viewed

@@ -79,18 +79,24 @@ installs
 inference
 ```python
 from transformers import pipeline
 from datasets import load_dataset
 import soundfile as sf
 synthesiser = pipeline("text-to-speech", "umarigan/speecht5_tts_tr_v1.0")
-embeddings_dataset = load_dataset("umarigan/turkish_voice_dataset_embedded", split="train[:500]", stream = True)
 speaker_embedding = torch.tensor(embeddings_dataset[736]["speaker_embeddings"]).unsqueeze(0)
-# You can replace this embedding with your own as well.
 speech = synthesiser("Bir berber bir berbere gel beraber bir berber kuralım demiş", forward_params={"speaker_embeddings": speaker_embedding})
 sf.write("speech.wav", speech["audio"], samplerate=speech["sampling_rate"])
 ```

 inference
 ```python
 from transformers import pipeline
 from datasets import load_dataset
 import soundfile as sf
+import torch
+from IPython.display import Audio
 synthesiser = pipeline("text-to-speech", "umarigan/speecht5_tts_tr_v1.0")
+embeddings_dataset = load_dataset("umarigan/turkish_voice_dataset_embedded", split="train")
 speaker_embedding = torch.tensor(embeddings_dataset[736]["speaker_embeddings"]).unsqueeze(0)
+# Synthesize speech using the embedding
 speech = synthesiser("Bir berber bir berbere gel beraber bir berber kuralım demiş", forward_params={"speaker_embeddings": speaker_embedding})
+# Save the generated audio to a file
 sf.write("speech.wav", speech["audio"], samplerate=speech["sampling_rate"])
+# Play the audio in the notebook
+Audio("speech.wav")
 ```