Spaces:

0notexist0
/

AudioOn

Sleeping

App Files Files Community

0notexist0 commited on 17 days ago

Commit

7cb8a3f

verified ·

1 Parent(s): e8f826b

Update app.py

Browse files

Files changed (1) hide show

app.py +35 -31

app.py CHANGED Viewed

@@ -1,11 +1,10 @@
 import gradio as gr
-from huggingface_hub import InferenceClient
 import os
-# Recupera il token in modo sicuro (Se restituisce None, lo segnaleremo nell'interfaccia)
 API_TOKEN = os.environ.get("htoken")
-# Dizionario dei migliori modelli gratuiti e Open Source disponibili per Text-to-Speech
 MODELLI_DISPONIBILI = {
     "Suno Bark Small (Multilingua, Espressivo ma lento)": "suno/bark-small",
     "Microsoft SpeechT5 (Inglese, Veloce e stabilissimo)": "microsoft/speecht5_tts",
@@ -15,47 +14,54 @@ MODELLI_DISPONIBILI = {
 }
 def genera_audio(testo, nome_modello):
-    # 1. Controllo hardware: Verifichiamo che il container abbia letto il token
     if not API_TOKEN:
-        return "ERRORE CRITICO: Il Token è vuoto. Devi fare 'Restart this Space' nelle impostazioni per caricare il Secret 'htoken'.", None
     if not testo.strip():
-        return "Errore: Inserisci del testo.", None
-    # 2. Recupera l'ID esatto del modello in base alla scelta dell'utente
     model_id = MODELLI_DISPONIBILI.get(nome_modello)
     try:
-        # Inizializza il client ufficiale
-        client = InferenceClient(token=API_TOKEN)
-        # Chiamata API ufficiale per l'audio
-        audio_bytes = client.text_to_speech(testo, model=model_id)
-        return f"Successo! Audio generato utilizzando il modello: {model_id}", audio_bytes
     except Exception as e:
-        errore_str = str(e)
-        messaggio_errore = f"Errore durante l'inferenza: {errore_str}\n\n"
-        # Analisi degli errori più comuni per aiutarti nel debug
-        if "401" in errore_str or "Invalid username" in errore_str:
-            messaggio_errore += "💡 SOLUZIONE: Il tuo Token non ha i permessi corretti o lo Space non è stato riavviato. Controlla che il token sia 'Finegrained' e fai Restart."
-        elif "503" in errore_str or "loading" in errore_str.lower():
-            messaggio_errore += "💡 SOLUZIONE: Questo specifico modello è in letargo sui server. Riprova tra 30 secondi o scegli un altro modello dal menu."
-        return messaggio_errore, None
-# Creazione dell'interfaccia UI
 with gr.Blocks(theme=gr.themes.Soft()) as interfaccia:
-    gr.Markdown("# Generatore Audio IA Multi-Modello")
-    gr.Markdown("Scegli tra i migliori modelli Open Source gratuiti. *Nota: i modelli inglesi hanno spesso una qualità vocale superiore su Hugging Face.*")
     with gr.Row():
         testo_input = gr.Textbox(label="Testo da generare", placeholder="Scrivi qui il tuo prompt...", lines=3)
         modello_dropdown = gr.Dropdown(
             choices=list(MODELLI_DISPONIBILI.keys()),
-            value="Suno Bark Small (Multilingua, Espressivo ma lento)",
             label="Scegli il Modello IA"
         )
@@ -64,12 +70,10 @@ with gr.Blocks(theme=gr.themes.Soft()) as interfaccia:
     status_output = gr.Textbox(label="Stato Console", lines=4)
     audio_output = gr.Audio(label="Player Audio", autoplay=True)
-    # Collegamento dell'interfaccia alla logica Python
     pulsante.click(
         fn=genera_audio,
         inputs=[testo_input, modello_dropdown],
         outputs=[status_output, audio_output]
     )
-# Avvio dell'app web
 interfaccia.launch()

 import gradio as gr
+import requests
 import os
+# Recupera il token dal Secret creato precedentemente
 API_TOKEN = os.environ.get("htoken")
 MODELLI_DISPONIBILI = {
     "Suno Bark Small (Multilingua, Espressivo ma lento)": "suno/bark-small",
     "Microsoft SpeechT5 (Inglese, Veloce e stabilissimo)": "microsoft/speecht5_tts",
 }
 def genera_audio(testo, nome_modello):
     if not API_TOKEN:
+        return "ERRORE: Token mancante. Assicurati di aver salvato il Secret 'htoken'.", None
     if not testo.strip():
+        return "Errore: Inserisci del testo da pronunciare.", None
     model_id = MODELLI_DISPONIBILI.get(nome_modello)
+    api_url = f"https://api-inference.huggingface.co/models/{model_id}"
+    # Intestazioni per la richiesta HTTP diretta, aggirando l'InferenceClient
+    headers = {
+        "Authorization": f"Bearer {API_TOKEN}",
+        "Content-Type": "application/json"
+    }
     try:
+        # Effettua la richiesta POST forzando l'inferenza
+        response = requests.post(api_url, headers=headers, json={"inputs": testo}, timeout=60)
+        # Gestione degli errori del server
+        if response.status_code == 503:
+            dati = response.json()
+            tempo = round(dati.get('estimated_time', 20))
+            return f"ATTESA: Il modello si sta accendendo (Errore 503). Riprova tra {tempo} secondi.", None
+        if response.status_code != 200:
+            return f"ERRORE SERVER {response.status_code}: {response.text}", None
+        # Salva i byte ricevuti in un file audio fisico temporaneo (metodo più stabile per Gradio)
+        file_path = "output.wav"
+        with open(file_path, "wb") as f:
+            f.write(response.content)
+        return f"Successo! Audio generato con il modello: {model_id}", file_path
     except Exception as e:
+        return f"Errore di rete/connessione: {str(e)}", None
+# Interfaccia Utente
 with gr.Blocks(theme=gr.themes.Soft()) as interfaccia:
+    gr.Markdown("# Generatore Audio IA (Metodo HTTP Diretto)")
+    gr.Markdown("Questa versione utilizza richieste HTTP pure per bypassare i blocchi della libreria ufficiale.")
     with gr.Row():
         testo_input = gr.Textbox(label="Testo da generare", placeholder="Scrivi qui il tuo prompt...", lines=3)
         modello_dropdown = gr.Dropdown(
             choices=list(MODELLI_DISPONIBILI.keys()),
+            value="Microsoft SpeechT5 (Inglese, Veloce e stabilissimo)",
             label="Scegli il Modello IA"
         )
     status_output = gr.Textbox(label="Stato Console", lines=4)
     audio_output = gr.Audio(label="Player Audio", autoplay=True)
     pulsante.click(
         fn=genera_audio,
         inputs=[testo_input, modello_dropdown],
         outputs=[status_output, audio_output]
     )
 interfaccia.launch()