IndicF5

Runtime error

App Files Files Community

high77 commited on Nov 18, 2025

Commit

81968d5

verified ·

1 Parent(s): 34c48df

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -21

app.py CHANGED Viewed

@@ -144,34 +144,28 @@ EXAMPLES = [
         "audio_name": "KAN_F (Happy)",
         "audio_url": "https://github.com/AI4Bharat/IndicF5/raw/refs/heads/main/prompts/KAN_F_HAPPY_00001.wav",
         "ref_text": "ನಮ್‌ ಫ್ರಿಜ್ಜಲ್ಲಿ  ಕೂಲಿಂಗ್‌ ಸಮಸ್ಯೆ ಆಗಿ ನಾನ್‌ ಭಾಳ ದಿನದಿಂದ ಒದ್ದಾಡ್ತಿದ್ದೆ, ಆದ್ರೆ ಅದ್ನೀಗ ಮೆಕಾನಿಕ್ ಆಗಿರೋ ನಿಮ್‌ ಸಹಾಯ್ದಿಂದ ಬಗೆಹರಿಸ್ಕೋಬೋದು ಅಂತಾಗಿ ನಿರಾಳ ಆಯ್ತು ನಂಗೆ.",
-        "synth_text": "ଦାକ୍ତର ଔଷଧ ଲେଖିଦେଲେ ମଧ୍ୟ। ଆପଣ କିଣିଦେଲେ ମଧ୍ୟ,ଘରକୁ ବି ଆଣିଦେଲେ। "
     },
 ]
-# ---------- SAFE PRE-FETCH EXAMPLES (GRADIO 4.x compatible) ----------
-for ex in EXAMPLES:
-    sr, data = load_audio_from_url(ex["audio_url"])
-    if data is None or len(data) == 0:
-        continue  # skip broken downloads
-    ex["sample_rate"] = sr if sr is not None else 24000
-    ex["audio_data"]  = data
-# build list – never contains None
-examples = []
-for ex in EXAMPLES:
-    if ex.get("audio_data") is not None:
-        examples.append([ex["synth_text"], (ex["sample_rate"], ex["audio_data"]), ex["ref_text"]])
-# ---------- GRADIO UI ----------
 with gr.Blocks() as iface:
     gr.Markdown(
         """
-        # **IndicF5: High-Quality Text-to-Speech for Indian Languages – Odia-prosody fixed**
         [![Hugging Face](https://img.shields.io/badge/HuggingFace-Model-orange)](https://huggingface.co/ai4bharat/IndicF5)
         We release **IndicF5**, a **near-human polyglot** **Text-to-Speech (TTS)** model trained on **1417 hours** of high-quality speech from **[Rasa](https://huggingface.co/datasets/ai4bharat/Rasa), [IndicTTS](https://www.iitm.ac.in/donlab/indictts/database), [LIMMITS](https://sites.google.com/view/limmits24/), and [IndicVoices-R](https://huggingface.co/datasets/ai4bharat/indicvoices_r)**.
         IndicF5 supports **11 Indian languages**:
         **Assamese, Bengali, Gujarati, Hindi, Kannada, Malayalam, Marathi, Odia, Punjabi, Tamil, Telugu.**
-        Generate speech using a reference prompt audio and its corresponding text – now with **Odia prosody preservation**.
         """
     )
@@ -185,10 +179,18 @@ with gr.Blocks() as iface:
         with gr.Column():
             output_audio = gr.Audio(label="Generated Speech", type="numpy")
-    # only show if we have valid examples
-    if examples:
-        gr.Examples(examples=examples, inputs=[text_input, ref_audio_input, ref_text_input], label="Choose an example:")
     submit_btn.click(synthesize_speech, inputs=[text_input, ref_audio_input, ref_text_input], outputs=[output_audio])
 iface.launch(share=True)

         "audio_name": "KAN_F (Happy)",
         "audio_url": "https://github.com/AI4Bharat/IndicF5/raw/refs/heads/main/prompts/KAN_F_HAPPY_00001.wav",
         "ref_text": "ನಮ್‌ ಫ್ರಿಜ್ಜಲ್ಲಿ  ಕೂಲಿಂಗ್‌ ಸಮಸ್ಯೆ ಆಗಿ ನಾನ್‌ ಭಾಳ ದಿನದಿಂದ ಒದ್ದಾಡ್ತಿದ್ದೆ, ಆದ್ರೆ ಅದ್ನೀಗ ಮೆಕಾನಿಕ್ ಆಗಿರೋ ನಿಮ್‌ ಸಹಾಯ್ದಿಂದ ಬಗೆಹರಿಸ್ಕೋಬೋದು ಅಂತಾಗಿ ನಿರಾಳ ಆಯ್ತು ನಂಗೆ.",
+        "synth_text": "ଦାକ୍ତର ଔଷଧ ଲେଖିଦେଲେ ମଧ୍ୟ। ଆପଣ କିଣିଦେଲେ ମଧ୍ୟ,ଘରକୁ ବି ଆଣିଦେଲେ।"
     },
 ]
+# Preload all example audios
+for example in EXAMPLES:
+    sample_rate, audio_data = load_audio_from_url(example["audio_url"])
+    example["sample_rate"] = sample_rate
+    example["audio_data"] = audio_data
+# Define Gradio interface with layout adjustments
 with gr.Blocks() as iface:
     gr.Markdown(
         """
+        # **IndicF5: High-Quality Text-to-Speech for Indian Languages**
         [![Hugging Face](https://img.shields.io/badge/HuggingFace-Model-orange)](https://huggingface.co/ai4bharat/IndicF5)
         We release **IndicF5**, a **near-human polyglot** **Text-to-Speech (TTS)** model trained on **1417 hours** of high-quality speech from **[Rasa](https://huggingface.co/datasets/ai4bharat/Rasa), [IndicTTS](https://www.iitm.ac.in/donlab/indictts/database), [LIMMITS](https://sites.google.com/view/limmits24/), and [IndicVoices-R](https://huggingface.co/datasets/ai4bharat/indicvoices_r)**.
         IndicF5 supports **11 Indian languages**:
         **Assamese, Bengali, Gujarati, Hindi, Kannada, Malayalam, Marathi, Odia, Punjabi, Tamil, Telugu.**
+        Generate speech using a reference prompt audio and its corresponding text.
         """
     )
         with gr.Column():
             output_audio = gr.Audio(label="Generated Speech", type="numpy")
+    # Add multiple examples
+    examples = [
+        [ex["synth_text"], (ex["sample_rate"], ex["audio_data"]), ex["ref_text"]] for ex in EXAMPLES
+    ]
+    gr.Examples(
+        examples=examples,
+        inputs=[text_input, ref_audio_input, ref_text_input],
+        label="Choose an example:"
+    )
     submit_btn.click(synthesize_speech, inputs=[text_input, ref_audio_input, ref_text_input], outputs=[output_audio])
 iface.launch(share=True)