Spaces:

sathvikt
/

TTS2

Build error

App Files Files Community

sathvikt commited on 5 days ago

Commit

e8bdfd6

verified ·

1 Parent(s): 0f7ed95

Upload 2 files

Browse files

Files changed (2) hide show

app.py +82 -0
requirements.txt +7 -0

app.py ADDED Viewed

	@@ -0,0 +1,82 @@

+import gradio as gr
+import torch
+import soundfile as sf
+import tempfile
+from parler_tts import ParlerTTSForConditionalGeneration
+from transformers import AutoTokenizer
+import os
+from huggingface_hub import login
+login(token=os.getenv("HF_TOKEN"))
+MODEL_NAME = "ai4bharat/indic-parler-tts"
+device = "cuda" if torch.cuda.is_available() else "cpu"
+print("🚀 Using device:", device)
+print("⏳ Loading Kannada TTS model...")
+model = ParlerTTSForConditionalGeneration.from_pretrained(
+    MODEL_NAME
+).to(device)
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+description_tokenizer = AutoTokenizer.from_pretrained(
+    model.config.text_encoder._name_or_path
+)
+print("✅ Model loaded successfully")
+# =========================================================
+# TTS FUNCTION
+# =========================================================
+def generate_kannada_tts(prompt_text):
+    prompt_text = str(prompt_text).strip()
+    if not prompt_text:
+        return None
+    description = (
+        "A calm Kannada male speaker with natural pronunciation, "
+        "clear studio quality audio, smooth narration, "
+        "and no background noise."
+    )
+    description_inputs = description_tokenizer(
+        description,
+        return_tensors="pt"
+    ).to(device)
+    prompt_inputs = tokenizer(
+        prompt_text,
+        return_tensors="pt"
+    ).to(device)
+    with torch.no_grad():
+        generation = model.generate(
+            input_ids=description_inputs.input_ids,
+            prompt_input_ids=prompt_inputs.input_ids
+        )
+    audio = generation.cpu().numpy().squeeze()
+    temp_wav = tempfile.NamedTemporaryFile(delete=False, suffix=".wav")
+    sf.write(temp_wav.name, audio, model.config.sampling_rate)
+    return temp_wav.name
+demo = gr.Interface(
+    fn=generate_kannada_tts,
+    inputs=gr.Textbox(
+        label="Enter Kannada Text",
+        placeholder="ನಮಸ್ಕಾರ, ನನ್ನ ಹೆಸರು ಅಥ್ಮಿಕ"
+    ),
+    outputs=gr.Audio(label="Generated Kannada Speech"),
+    title="Kannada Text To Speech using AI4Bharat",
+    description="Deep Learning based Kannada TTS model for project presentation"
+)
+demo.launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,7 @@

+gradio
+git+https://github.com/huggingface/parler-tts.git
+soundfile
+transformers
+accelerate
+sentencepiece
+torch