Spaces:

0notexist0
/

AudioOn

Sleeping

App Files Files Community

0notexist0 commited on 24 days ago

Commit

63454b5

verified ·

1 Parent(s): b7d7e4a

Update app.py

Browse files

Files changed (1) hide show

app.py +42 -34

app.py CHANGED Viewed

@@ -1,51 +1,59 @@
 import gradio as gr
-from transformers import pipeline
-import scipy.io.wavfile as wavfile
 import os
-# Recuperiamo il tuo token segreto
 API_TOKEN = os.environ.get("htoken")
-# INIZIALIZZAZIONE LOCALE CON AUTENTICAZIONE:
-# Ora passiamo il token autorizzato per permettere il download del modello nella RAM!
-modello_tts = pipeline("text-to-speech", model="facebook/mms-tts-ita", token=API_TOKEN)
-def genera_audio_locale(testo):
     if not testo.strip():
-        return "Errore: Inserisci del testo.", None
     try:
-        # Inferenza pura sulla CPU dello Space
-        risultato = modello_tts(testo)
-        audio_array = risultato["audio"][0]
-        sample_rate = risultato["sampling_rate"]
-        percorso_file = "output_locale.wav"
-        wavfile.write(percorso_file, sample_rate, audio_array)
-        return "✅ Audio generato fisicamente sul server locale (Zero API esterne)!", percorso_file
     except Exception as e:
-        return f"❌ Errore di calcolo hardware locale: {str(e)}", None
-# Interfaccia Utente
 with gr.Blocks(theme=gr.themes.Soft()) as interfaccia:
-    gr.Markdown("# Generatore Audio IA (Esecuzione 100% Locale)")
-    gr.Markdown("Questa versione elabora l'audio direttamente sul processore del server. Nessun blocco API.")
     with gr.Row():
-        testo_input = gr.Textbox(label="Testo da generare (Italiano)", placeholder="Scrivi qui il tuo prompt...", lines=3)
-    pulsante = gr.Button("Genera Audio Offline", variant="primary")
-    status_output = gr.Textbox(label="Stato Console", lines=3)
-    audio_output = gr.Audio(label="Player Audio", type="filepath", autoplay=True)
-    pulsante.click(
-        fn=genera_audio_locale,
-        inputs=[testo_input],
-        outputs=[status_output, audio_output]
-    )
 interfaccia.launch()

 import gradio as gr
+from huggingface_hub import InferenceClient, HfApi
 import os
+# Recupero Token
 API_TOKEN = os.environ.get("htoken")
+client = InferenceClient(token=API_TOKEN)
+def recupera_modelli_reali():
+    """Interroga Hugging Face per trovare i modelli TTS reali più popolari"""
+    api = HfApi()
+    try:
+        # Cerchiamo modelli nella categoria 'text-to-speech' ordinati per download
+        modelli = api.list_models(
+            filter="text-to-speech",
+            sort="downloads",
+            direction=-1,
+            limit=15
+        )
+        # Creiamo una lista di stringhe con i nomi reali (es. 'suno/bark-small')
+        return [m.id for m in modelli]
+    except Exception:
+        # Se la ricerca fallisce, usiamo dei fallback sicuri che sappiamo esistere
+        return ["suno/bark-small", "microsoft/speecht5_tts", "espnet/kan-bayashi_ljspeech_vits"]
+# Popoliamo la lista una volta sola all'avvio
+LISTA_MODELLI_DINAMICA = recupera_modelli_reali()
+def genera_audio(testo, model_id):
     if not testo.strip():
+        return "Inserisci del testo.", None
     try:
+        # Chiamata diretta con il model_id scelto dalla lista reale
+        audio_bytes = client.text_to_speech(testo, model=model_id)
+        return f"✅ Generato con: {model_id}", audio_bytes
     except Exception as e:
+        return f"❌ Errore: {str(e)}", None
+# Interfaccia Gradio
 with gr.Blocks(theme=gr.themes.Soft()) as interfaccia:
+    gr.Markdown("# Browser Modelli Hugging Face TTS")
+    gr.Markdown("Questa lista è popolata automaticamente cercando i modelli reali sui server.")
     with gr.Row():
+        testo_input = gr.Textbox(label="Testo", placeholder="Scrivi qualcosa...")
+        # Il menu a tendina ora usa la lista scaricata dai server
+        modello_dropdown = gr.Dropdown(
+            choices=LISTA_MODELLI_DINAMICA,
+            value=LISTA_MODELLI_DINAMICA[0],
+            label="Seleziona Modello Esistente"
+        )
+    pulsante = gr.Button("Genera Audio", variant="primary")
+    status = gr.Textbox(label="Console")
+    audio = gr.Audio(label="Player")
+    pulsante.click(fn=genera_audio, inputs=[testo_input, modello_dropdown], outputs=[status, audio])
 interfaccia.launch()