Spaces:

gnosticdev
/

interferencia-arconte

Sleeping

App Files Files Community

gnosticdev commited on 10 days ago

Commit

023e8cf

verified ·

1 Parent(s): 0bdf697

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -22

app.py CHANGED Viewed

@@ -2,6 +2,8 @@ import gradio as gr
 import numpy as np
 import librosa
 from scipy.fft import fft, fftfreq
 # ---- ABECEDARIO DE FRECUENCIAS ----
 ABECEDARIO = {
@@ -14,8 +16,13 @@ ABECEDARIO = {
 FRECUENCIAS = np.array(list(ABECEDARIO.values()))
 LETRAS = list(ABECEDARIO.keys())
-# ---- Función principal: decodificar audio ----
-def decodificar_audio(audio_path, progress=gr.Progress()):
     if audio_path is None:
         return "⚠️ Sin audio"
@@ -23,7 +30,6 @@ def decodificar_audio(audio_path, progress=gr.Progress()):
     n = len(y)
     secuencia = ""
-    # Analizar en ventanas de 50 ms
     ventana_ms = 50
     ventana_len = int(sr * ventana_ms / 1000)
@@ -32,22 +38,14 @@ def decodificar_audio(audio_path, progress=gr.Progress()):
         if len(frame) == 0:
             continue
-        # FFT de la ventana
         yf_frame = fft(frame)
         magn = np.abs(yf_frame[:len(frame)//2])
         freqs = fftfreq(len(frame), 1/sr)[:len(frame)//2]
-        # Normalizar magnitud relativa (distribución de energía)
-        magn_rel = magn / (np.sum(magn) + 1e-9)
-        # Frecuencia dominante relativa
-        idx_max = np.argmax(magn_rel)
-        freq_max = freqs[idx_max]
-        # Asignar letra más cercana
-        idx_letra = (np.abs(FRECUENCIAS - freq_max)).argmin()
-        letra = LETRAS[idx_letra]
-        secuencia += letra
     # Eliminar repeticiones consecutivas
     secuencia_limpia = ""
@@ -57,18 +55,36 @@ def decodificar_audio(audio_path, progress=gr.Progress()):
             secuencia_limpia += c
             prev = c
-    reporte = "SECUENCIA DETECTADA\n"
-    reporte += secuencia + "\n\n"
-    reporte += "SECUENCIA LIMPIA\n"
-    reporte += secuencia_limpia + "\n\n"
     return reporte
 # ---- Interfaz Gradio ----
 with gr.Blocks() as demo:
-    gr.Markdown("# Decodificador de Frecuencias Real (Objetivo, Sin Filtrado)")
     audio = gr.Audio(type="filepath", sources=["upload","microphone"])
-    btn = gr.Button("Decodificar")
-    salida = gr.Textbox(lines=15)
     btn.click(decodificar_audio, inputs=audio, outputs=salida)
 demo.launch()

 import numpy as np
 import librosa
 from scipy.fft import fft, fftfreq
+from transformers import GPT2LMHeadModel, GPT2Tokenizer
+import torch
 # ---- ABECEDARIO DE FRECUENCIAS ----
 ABECEDARIO = {
 FRECUENCIAS = np.array(list(ABECEDARIO.values()))
 LETRAS = list(ABECEDARIO.keys())
+# ---- Cargar modelo GPT-2 pequeño ----
+MODEL_NAME = "gpt2"  # modelo gratis local
+tokenizer = GPT2Tokenizer.from_pretrained(MODEL_NAME)
+model = GPT2LMHeadModel.from_pretrained(MODEL_NAME)
+# ---- Función para decodificar audio a letras ----
+def decodificar_audio(audio_path):
     if audio_path is None:
         return "⚠️ Sin audio"
     n = len(y)
     secuencia = ""
     ventana_ms = 50
     ventana_len = int(sr * ventana_ms / 1000)
         if len(frame) == 0:
             continue
         yf_frame = fft(frame)
         magn = np.abs(yf_frame[:len(frame)//2])
         freqs = fftfreq(len(frame), 1/sr)[:len(frame)//2]
+        # Tomar todas las frecuencias
+        for f in freqs:
+            idx_letra = (np.abs(FRECUENCIAS - f)).argmin()
+            secuencia += LETRAS[idx_letra]
     # Eliminar repeticiones consecutivas
     secuencia_limpia = ""
             secuencia_limpia += c
             prev = c
+    # Generar palabras y frases con GPT-2
+    palabras, frases = generar_palabras_frases_gpt2(secuencia_limpia)
+    reporte = "SECUENCIA DETECTADA\n" + secuencia + "\n\n"
+    reporte += "SECUENCIA LIMPIA\n" + secuencia_limpia + "\n\n"
+    reporte += "PALABRAS GENERADAS\n" + ", ".join(palabras) + "\n\n"
+    reporte += "FRASES GENERADAS\n" + "\n".join(frases[:10])
     return reporte
+# ---- IA real GPT-2: genera palabras y frases ----
+def generar_palabras_frases_gpt2(secuencia):
+    prompt = f"Usa solo estas letras para formar palabras: {secuencia}\nPalabras y frases:"
+    inputs = tokenizer.encode(prompt, return_tensors="pt")
+    outputs = model.generate(inputs, max_length=100, do_sample=True, temperature=0.9, top_p=0.95)
+    texto_generado = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    # Filtrar solo letras permitidas y separar palabras
+    letras_permitidas = set(secuencia + " ")
+    texto_filtrado = "".join([c for c in texto_generado.upper() if c in letras_permitidas])
+    palabras = texto_filtrado.split()
+    frases = [" ".join(palabras[i:i+5]) for i in range(0, len(palabras), 5)]
+    return palabras, frases
 # ---- Interfaz Gradio ----
 with gr.Blocks() as demo:
+    gr.Markdown("# Decodificador de Frecuencias Real + GPT-2 Compositor")
     audio = gr.Audio(type="filepath", sources=["upload","microphone"])
+    btn = gr.Button("Decodificar y Componer")
+    salida = gr.Textbox(lines=20)
     btn.click(decodificar_audio, inputs=audio, outputs=salida)
 demo.launch()