Spaces:

gnosticdev
/

interferencia-arconte

Sleeping

App Files Files Community

gnosticdev commited on Mar 9

Commit

bd0c979

verified ·

1 Parent(s): 2de54da

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -41

app.py CHANGED Viewed

@@ -2,7 +2,7 @@ import gradio as gr
 import numpy as np
 import librosa
 from scipy.fft import fft, fftfreq
-from transformers import GPT2Tokenizer, GPT2LMHeadModel
 # ---- ABECEDARIO DE FRECUENCIAS ----
 ABECEDARIO = {
@@ -11,19 +11,19 @@ ABECEDARIO = {
     'P': 1800,'Q': 1900,'R': 2000,'S': 2100,'T': 2200,'U': 2300,'V': 2400,
     'W': 2500,'X': 2600,'Y': 2700,'Z': 2800,' ': 0
 }
 FRECUENCIAS = np.array(list(ABECEDARIO.values()))
 LETRAS = list(ABECEDARIO.keys())
-# ---- Cargar diccionario real ----
-with open("diccionario.txt", "r", encoding="utf-8") as f:
-    PALABRAS_REALES = set([line.strip().upper() for line in f if line.strip()])
-# ---- Cargar GPT-2 ----
-tokenizer = GPT2Tokenizer.from_pretrained("gpt2")
-model = GPT2LMHeadModel.from_pretrained("gpt2")
-# ---- Decodificar audio a letras ----
-def decodificar_audio(audio_path):
     if audio_path is None:
         return "⚠️ Sin audio"
@@ -41,11 +41,13 @@ def decodificar_audio(audio_path):
         yf_frame = fft(frame)
         magn = np.abs(yf_frame[:len(frame)//2])
         freqs = fftfreq(len(frame), 1/sr)[:len(frame)//2]
-        for f in freqs:
-            idx_letra = (np.abs(FRECUENCIAS - f)).argmin()
-            secuencia += LETRAS[idx_letra]
-    # Secuencia limpia
     secuencia_limpia = ""
     prev = None
     for c in secuencia:
@@ -53,40 +55,24 @@ def decodificar_audio(audio_path):
             secuencia_limpia += c
             prev = c
-    # Generar palabras usando GPT-2 + filtrado por diccionario
-    palabras, frases = generar_palabras_frases_gpt2(secuencia_limpia)
     reporte = "SECUENCIA DETECTADA\n" + secuencia + "\n\n"
     reporte += "SECUENCIA LIMPIA\n" + secuencia_limpia + "\n\n"
-    reporte += "PALABRAS GENERADAS\n" + ", ".join(palabras) + "\n\n"
-    reporte += "FRASES GENERADAS\n" + "\n".join(frases[:10])
     return reporte
-# ---- GPT-2 determinista + filtrado ----
-def generar_palabras_frases_gpt2(secuencia):
-    secuencia_recortada = secuencia[-500:] if len(secuencia) > 500 else secuencia
-    prompt = f"Forma palabras usando solo estas letras: {secuencia_recortada}. Palabras y frases:"
-    inputs = tokenizer.encode(prompt, return_tensors="pt")
-    outputs = model.generate(
-        inputs,
-        max_new_tokens=100,
-        do_sample=False
-    )
-    texto_generado = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    letras_permitidas = set(secuencia + " ")
-    texto_filtrado = "".join([c.upper() for c in texto_generado if c.upper() in letras_permitidas])
-    palabras = texto_filtrado.split()
-    # Filtrar solo palabras reales
-    palabras = [p for p in palabras if p in PALABRAS_REALES]
-    frases = [" ".join(palabras[i:i+5]) for i in range(0, len(palabras), 5)]
-    return palabras, frases
-# ---- Interfaz Gradio ----
 with gr.Blocks() as demo:
-    gr.Markdown("# Decodificador de Frecuencias + Palabras Reales con GPT-2")
     audio = gr.Audio(type="filepath", sources=["upload","microphone"])
-    btn = gr.Button("Decodificar y Componer")
     salida = gr.Textbox(lines=20)
     btn.click(decodificar_audio, inputs=audio, outputs=salida)
-demo.launch()

 import numpy as np
 import librosa
 from scipy.fft import fft, fftfreq
+from datasets import load_dataset
 # ---- ABECEDARIO DE FRECUENCIAS ----
 ABECEDARIO = {
     'P': 1800,'Q': 1900,'R': 2000,'S': 2100,'T': 2200,'U': 2300,'V': 2400,
     'W': 2500,'X': 2600,'Y': 2700,'Z': 2800,' ': 0
 }
 FRECUENCIAS = np.array(list(ABECEDARIO.values()))
 LETRAS = list(ABECEDARIO.keys())
+# ---- CARGAR DICCIONARIO REAL ----
+ds = load_dataset("Kukedlc/Big-Spanish-1.2M", split="train")
+PALABRAS_REALES = set()
+for txt in ds["text"]:
+    for w in txt.split():
+        PALABRAS_REALES.add(w.upper())
+# ---- FUNCIONES ----
+def decodificar_audio(audio_path, progress=gr.Progress()):
     if audio_path is None:
         return "⚠️ Sin audio"
         yf_frame = fft(frame)
         magn = np.abs(yf_frame[:len(frame)//2])
         freqs = fftfreq(len(frame), 1/sr)[:len(frame)//2]
+        magn_rel = magn / (np.sum(magn) + 1e-9)
+        idx_max = np.argmax(magn_rel)
+        freq_max = freqs[idx_max]
+        idx_letra = (np.abs(FRECUENCIAS - freq_max)).argmin()
+        letra = LETRAS[idx_letra]
+        secuencia += letra
     secuencia_limpia = ""
     prev = None
     for c in secuencia:
             secuencia_limpia += c
             prev = c
+    letras_disponibles = set(secuencia_limpia)
+    palabras_validas = [w for w in PALABRAS_REALES if set(w).issubset(letras_disponibles)]
+    palabras_validas = sorted(palabras_validas, key=lambda x: -len(x))[:50]
+    frases = []
+    for i in range(0, len(palabras_validas), 5):
+        frases.append(" ".join(palabras_validas[i:i+5]))
     reporte = "SECUENCIA DETECTADA\n" + secuencia + "\n\n"
     reporte += "SECUENCIA LIMPIA\n" + secuencia_limpia + "\n\n"
+    reporte += "PALABRAS GENERADAS\n" + ", ".join(palabras_validas) + "\n\n"
+    reporte += "FRASES GENERADAS\n" + "\n".join(frases) + "\n"
     return reporte
 with gr.Blocks() as demo:
+    gr.Markdown("# Decodificador de Frecuencias Real + Palabras Reales")
     audio = gr.Audio(type="filepath", sources=["upload","microphone"])
+    btn = gr.Button("Decodificar")
     salida = gr.Textbox(lines=20)
     btn.click(decodificar_audio, inputs=audio, outputs=salida)
+demo.launch()