Spaces:

gnosticdev
/

fractal

Sleeping

App Files Files Community

gnosticdev commited on 7 days ago

Commit

5859700

verified ·

1 Parent(s): c461e0c

Update app.py

Browse files

Files changed (1) hide show

app.py +79 -62

app.py CHANGED Viewed

@@ -1,70 +1,87 @@
 import gradio as gr
-import numpy as np
-from scipy import signal
-# Tabla DTMF estándar
-DTMF_TABLE = {
-    (697, 1209): '1', (697, 1336): '2', (697, 1477): '3', (697, 1633): 'A',
-    (770, 1209): '4', (770, 1336): '5', (770, 1477): '6', (770, 1633): 'B',
-    (852, 1209): '7', (852, 1336): '8', (852, 1477): '9', (852, 1633): 'C',
-    (941, 1209): '*', (941, 1336): '0', (941, 1477): '#', (941, 1633): 'D'
-}
-def detectar_dtmf(audio, samplerate):
-    ventana = int(0.1 * samplerate)
-    paso = int(0.05 * samplerate)
-    teclas = []
-    frecuencias_dtmf = [697, 770, 852, 941, 1209, 1336, 1477, 1633]
-    for inicio in range(0, len(audio) - ventana, paso):
-        segmento = audio[inicio:inicio + ventana]
-        fft = np.fft.rfft(segmento)
-        freqs = np.fft.rfftfreq(len(segmento), 1/samplerate)
-        magnitud = np.abs(fft)
-        magnitud = magnitud / np.max(magnitud)
-        detectadas = []
-        for f_target in frecuencias_dtmf:
-            idx = np.argmin(np.abs(freqs - f_target))
-            if magnitud[idx] > 0.3:
-                detectadas.append(f_target)
-        if len(detectadas) == 2:
-            baja, alta = min(detectadas), max(detectadas)
-            for (fb, fa), tecla in DTMF_TABLE.items():
-                if abs(baja - fb) < 10 and abs(alta - fa) < 10:
-                    teclas.append((inicio/samplerate, tecla))
-                    break
-    return teclas
-def audio_a_letras(audio):
-    if audio is None:
-        return "Esperando audio..."
-    samplerate, data = audio
-    if len(data.shape) > 1:
-        data = data.mean(axis=1)
-    if data.dtype in (np.float32, np.float64):
-        data = (data * 32767).astype(np.int16)
-    teclas = detectar_dtmf(data, samplerate)
-    if not teclas:
-        return "No se detectaron tonos DTMF"
-    resultado = "TECLAS:\n"
-    for t, tecla in teclas:
-        resultado += f"{t:.2f}s: {tecla}\n"
-    resultado += f"\nTEXTO: {''.join([t[1] for t in teclas])}"
-    return resultado
-with gr.Blocks() as demo:
-    gr.Markdown("# Decodificador DTMF")
     with gr.Row():
-        # 👇 ESTA ES LA LÍNEA CORREGIDA
-        audio = gr.Audio(sources=["microphone"], type="numpy", label="Grabar o subir")
-        btn = gr.Button("Decodificar")
-    texto = gr.Textbox(label="Resultado", lines=10)
-    btn.click(fn=audio_a_letras, inputs=audio, outputs=texto)
-demo.launch()

 import gradio as gr
+import whisper
+import os
+import torch
+# --- Configuración Global ---
+# Usamos 'tiny' para velocidad en CPU gratis.
+# Cambiar a 'base' si tienes GPU pagada o más paciencia.
+MODEL_NAME = "tiny"
+device = "cuda" if torch.cuda.is_available() else "cpu"
+print(f"🌀 Cargando modelo Whisper ({MODEL_NAME}) en {device}...")
+try:
+    model = whisper.load_model(MODEL_NAME, device=device)
+    print("✅ Modelo cargado correctamente.")
+except Exception as e:
+    print(f"⚠️ Error cargando modelo: {e}")
+    model = None
+def analizar_audio_evp(audio_path):
+    """
+    Analiza el audio buscando patrones lingüísticos en el ruido.
+    """
+    if model is None:
+        return "❌ Error: El modelo no se cargó correctamente en el servidor."
+    if audio_path is None:
+        return "⚠️ No se detectó audio. Por favor graba o sube un archivo."
+    try:
+        # Opciones de transcripción agresivas para EVP
+        # temperature=0.8 ayuda a encontrar patrones en ruido (menos determinista)
+        # condition_on_previous_text=False evita que el modelo se 'bloquee' si no oye nada claro
+        options = {
+            "language": "es",
+            "fp16": False if device == "cpu" else True, # FP16 suele fallar en CPU
+            "temperature": 0.8,
+            "condition_on_previous_text": False,
+            "verbose": False
+        }
+        print(f"🔍 Analizando archivo: {audio_path}...")
+        result = model.transcribe(audio_path, **options)
+        texto = result["text"].strip()
+        if texto:
+            return f"👻 **PATRÓN DETECTADO:**\n\n"{texto}""
+        else:
+            return "💤 **SIN PATRONES:**\n\nEl IA no encontró estructuras lingüísticas claras en este ruido (o el silencio es absoluto)."
+    except Exception as e:
+        return f"⚠️ **ERROR DE PROCESAMIENTO:**\n\n{str(e)}"
+# --- Interfaz Gráfica (Gradio) ---
+with gr.Blocks(theme=gr.themes.Soft(primary_hue="purple")) as demo:
+    gr.Markdown("""
+    # 🕵️‍♂️ Detector de Patrones Auditivos (EVP)
+    ## Sube un MP3 de "silencio" o graba tu habitación.
+    *La IA intentará encontrar palabras donde solo hay ruido.*
+    """)
     with gr.Row():
+        with gr.Column():
+            audio_input = gr.Audio(
+                label="🎙️ Fuente de Audio",
+                type="filepath", # Importante: devuelve la ruta del archivo
+                sources=["upload", "microphone"],
+                format="mp3" # Forzamos formato MP3
+            )
+            btn_analizar = gr.Button("🔮 Analizar Ruido", variant="primary")
+        with gr.Column():
+            output_text = gr.Textbox(
+                label="📜 Resultado del Análisis",
+                lines=5,
+                max_lines=10
+            )
+    # Conectar botón a función
+    btn_analizar.click(
+        fn=analizar_audio_evp,
+        inputs=audio_input,
+        outputs=output_text
+    )
+if __name__ == "__main__":
+    demo.launch()