Spaces:

gnosticdev
/

interferencia-arconte

Sleeping

App Files Files Community

gnosticdev commited on Mar 9

Commit

905cd24

verified ·

1 Parent(s): 16d63c5

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -17

app.py CHANGED Viewed

@@ -6,13 +6,12 @@ from sklearn.cluster import KMeans
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
-# ------ Modelo de Lenguaje ------
-MODEL_NAME = "gpt2"  # GPT2 entrenado en españoll
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
-# ------ Decodificador de Tonos ------
 class DigitalToneDecoder:
     def __init__(self, frame_ms=40, min_freq=300, max_freq=4000, peak_threshold=0.2, symbols=16):
         self.frame_ms = frame_ms
@@ -40,22 +39,17 @@ class DigitalToneDecoder:
     def detectar_tonos(self, stft, freqs):
         tonos = []
         media_global = np.mean(stft)
         for frame in stft.T:
             if np.mean(frame) < media_global * 0.5:
                 continue
             frame_norm = frame / np.max(frame)
             peaks, _ = find_peaks(frame_norm, height=self.peak_threshold)
             if len(peaks) == 0:
                 continue
             peak = peaks[np.argmax(frame_norm[peaks])]
             freq = freqs[peak]
             if self.min_freq <= freq <= self.max_freq:
                 tonos.append(freq)
         return np.array(tonos)
     def crear_simbolos(self, tonos):
@@ -79,13 +73,25 @@ class DigitalToneDecoder:
             out += letras[idx % len(letras)]
         return out
-# ----- IA: Generador de Palabras/Frases -----
 def generar_texto_ia(letras):
     prompt = (
         f"Secuencia de letras: {letras}\n"
-        "Genera palabras plausibles en español y luego frases con esas palabras:\n"
     )
     input_ids = tokenizer(prompt, return_tensors="pt").input_ids
     out = model.generate(
         input_ids,
@@ -98,7 +104,7 @@ def generar_texto_ia(letras):
     texto = tokenizer.decode(out[0], skip_special_tokens=True)
     return texto
-# ----- Interfaz -----
 def analizar(audio_path, progress=gr.Progress()):
     if audio_path is None:
         return "Sin audio"
@@ -113,18 +119,18 @@ def analizar(audio_path, progress=gr.Progress()):
     progress(0.8)
     centros = decoder.crear_simbolos(tonos)
     seq = decoder.decodificar(tonos, centros)
-    ia = generar_texto_ia(seq)
     reporte = ""
     reporte += "SECUENCIA DETECTADA\n"
     reporte += seq + "\n\n"
     reporte += "TEXTO GENERADO POR IA\n"
-    reporte += ia
     return reporte
 with gr.Blocks() as demo:
-    gr.Markdown("# Decodificador + Generador de Palabras/Frases con IA")
     audio = gr.Audio(type="filepath", sources=["upload","microphone"])
     boton = gr.Button("Procesar")
     salida = gr.Textbox(lines=15)

 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer
+# ---- Modelo GPT-2 ----
+MODEL_NAME = "gpt2"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
+# ---- Decodificador de Tonos ----
 class DigitalToneDecoder:
     def __init__(self, frame_ms=40, min_freq=300, max_freq=4000, peak_threshold=0.2, symbols=16):
         self.frame_ms = frame_ms
     def detectar_tonos(self, stft, freqs):
         tonos = []
         media_global = np.mean(stft)
         for frame in stft.T:
             if np.mean(frame) < media_global * 0.5:
                 continue
             frame_norm = frame / np.max(frame)
             peaks, _ = find_peaks(frame_norm, height=self.peak_threshold)
             if len(peaks) == 0:
                 continue
             peak = peaks[np.argmax(frame_norm[peaks])]
             freq = freqs[peak]
             if self.min_freq <= freq <= self.max_freq:
                 tonos.append(freq)
         return np.array(tonos)
     def crear_simbolos(self, tonos):
             out += letras[idx % len(letras)]
         return out
+# ---- Preprocesamiento de letras ----
+def limpiar_repeticiones(texto):
+    resultado = ""
+    prev = None
+    for c in texto:
+        if c != prev:
+            resultado += c
+            prev = c
+    return resultado
+# ---- Generador de palabras/frases con IA ----
 def generar_texto_ia(letras):
+    letras = limpiar_repeticiones(letras)
     prompt = (
         f"Secuencia de letras: {letras}\n"
+        "Interpreta estas letras como posibles palabras o mensaje encriptado en otras dimensiones de la matrix,
+        y luego construye frases con ellas si lo ves conveniente, si no. "
+        "Devuelve solo palabras y frases separadas en español o ingles, sin URLs ni texto irrelevante:\n"
     )
     input_ids = tokenizer(prompt, return_tensors="pt").input_ids
     out = model.generate(
         input_ids,
     texto = tokenizer.decode(out[0], skip_special_tokens=True)
     return texto
+# ---- Función principal ----
 def analizar(audio_path, progress=gr.Progress()):
     if audio_path is None:
         return "Sin audio"
     progress(0.8)
     centros = decoder.crear_simbolos(tonos)
     seq = decoder.decodificar(tonos, centros)
+    ia_text = generar_texto_ia(seq)
     reporte = ""
     reporte += "SECUENCIA DETECTADA\n"
     reporte += seq + "\n\n"
     reporte += "TEXTO GENERADO POR IA\n"
+    reporte += ia_text
     return reporte
+# ---- Interfaz Gradio ----
 with gr.Blocks() as demo:
+    gr.Markdown("# Decodificador + Generador de Palabras/Frases con GPT-2")
     audio = gr.Audio(type="filepath", sources=["upload","microphone"])
     boton = gr.Button("Procesar")
     salida = gr.Textbox(lines=15)