Spaces:

Leches33
/

AI

Sleeping

App Files Files Community

Leches33 commited on Feb 23

Commit

4aa47aa

verified ·

1 Parent(s): 80288b2

Update app.py

Browse files

Files changed (1) hide show

app.py +50 -23

app.py CHANGED Viewed

@@ -1,4 +1,5 @@
 # -*- coding: utf-8 -*-
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
@@ -7,7 +8,7 @@ import os
 import random
 import numpy as np
-# --- 1. DETERMINISMO TOTAL ---
 def set_seed(seed=42):
     random.seed(seed)
     np.random.seed(seed)
@@ -40,68 +41,94 @@ class MiniGPT(nn.Module):
         self.ln = nn.LayerNorm(embed_size)
         self.fc_out = nn.Linear(embed_size, v_size)
-    def forward(self, idx, targets=None):
         B, T = idx.shape
         T = min(T, block_size)
         idx = idx[:, -T:]
         tok_emb = self.token_embedding(idx)
         pos = torch.arange(T, device=device)
         pos_emb = self.pos_embedding(pos)[None, :, :]
         x = tok_emb + pos_emb
         mask = torch.triu(torch.ones(T, T, device=device), diagonal=1).bool()
         for block in self.blocks:
             x = block(x, src_mask=mask)
-        x = self.ln(x)
-        logits = self.fc_out(x)
-        return logits, None
-# --- CARGA DEL MODELO ---
 model = MiniGPT(vocab_size).to(device)
 if os.path.exists("mini_gpt.pth"):
     try:
         model.load_state_dict(torch.load("mini_gpt.pth", map_location=device))
     except Exception as e:
-        print(f"Error al cargar pesos: {e}")
 model.eval()
-# --- FUNCIÓN DE RESPUESTA OPTIMIZADA ---
 def responder(mensaje, historial):
     contexto = f"### Human: {mensaje}\n### Assistant: "
     tokens = [ord(c) if ord(c) < 256 else 32 for c in contexto]
     ai_txt = ""
     with torch.no_grad():
-        for _ in range(100):
             idx = torch.tensor([tokens[-block_size:]], dtype=torch.long).to(device)
             logits, _ = model(idx)
-            # Greedy Search (Determinista)
-            next_token = torch.argmax(logits[:, -1, :], dim=-1).item()
             char = chr(next_token)
-            if char == "\n" and len(ai_txt) > 5: break
-            if "### Human:" in ai_txt: break
             tokens.append(next_token)
             ai_txt += char
     output = ai_txt.split("###")[0].strip()
-    if not output:
-        return "Lo siento, todavía estoy aprendiendo de este dataset..."
     return output
-# --- INTERFAZ GRADIO ---
-# Eliminado el argumento 'theme' para evitar el TypeError en el servidor de HF
 demo = gr.ChatInterface(
     fn=responder,
-    title="Mi IA Personal (Sync Edition)",
-    description="Entrenando en PC -> Desplegado en HF. Sincronización de respuestas activa.",
-    examples=["Hola", "¿Qué tal?", "Cuéntame algo"]
 )
 if __name__ == "__main__":

 # -*- coding: utf-8 -*-
+# -*- coding: utf-8 -*-
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
 import random
 import numpy as np
+# --- 1. DETERMINISMO ---
 def set_seed(seed=42):
     random.seed(seed)
     np.random.seed(seed)
         self.ln = nn.LayerNorm(embed_size)
         self.fc_out = nn.Linear(embed_size, v_size)
+    def forward(self, idx):
         B, T = idx.shape
         T = min(T, block_size)
         idx = idx[:, -T:]
         tok_emb = self.token_embedding(idx)
         pos = torch.arange(T, device=device)
         pos_emb = self.pos_embedding(pos)[None, :, :]
         x = tok_emb + pos_emb
         mask = torch.triu(torch.ones(T, T, device=device), diagonal=1).bool()
         for block in self.blocks:
             x = block(x, src_mask=mask)
+        return self.fc_out(self.ln(x)), None
+# --- CARGAR EL MODELO ---
 model = MiniGPT(vocab_size).to(device)
 if os.path.exists("mini_gpt.pth"):
     try:
+        # Cargamos los pesos sincronizados desde tu PC
         model.load_state_dict(torch.load("mini_gpt.pth", map_location=device))
     except Exception as e:
+        print(f"Error cargando pesos: {e}")
 model.eval()
+# --- FUNCIÓN DE RESPUESTA CON FILTROS ANTI-BUCLE ---
 def responder(mensaje, historial):
+    # Usamos el formato de tu dataset para guiar a la IA
     contexto = f"### Human: {mensaje}\n### Assistant: "
     tokens = [ord(c) if ord(c) < 256 else 32 for c in contexto]
     ai_txt = ""
+    # Variables de control de repetición
+    ultimo_char = ""
+    contador_repeticion = 0
     with torch.no_grad():
+        for _ in range(150): # Aumentamos un poco el límite de respuesta
             idx = torch.tensor([tokens[-block_size:]], dtype=torch.long).to(device)
             logits, _ = model(idx)
+            # Tomamos el último paso y aplicamos Temperatura suave
+            logits = logits[:, -1, :] / 0.8
+            # --- PENALIZACIÓN DE REPETICIÓN ---
+            # Bajamos la probabilidad de los últimos 3 tokens usados para evitar bucles
+            for t in set(tokens[-3:]):
+                logits[0, t] -= 1.5
+            # Greedy Search (Elección del más probable)
+            next_token = torch.argmax(logits, dim=-1).item()
             char = chr(next_token)
+            # --- DETECTOR DE ATASCOS ---
+            if char == ultimo_char:
+                contador_repeticion += 1
+            else:
+                contador_repeticion = 0
+                ultimo_char = char
+            # Si repite el mismo carácter (como las comillas) más de 3 veces, cortamos
+            if contador_repeticion > 3:
+                break
+            # Si detecta un salto de línea y ya ha escrito algo, finaliza
+            if char == "\n" and len(ai_txt) > 10:
+                break
+            # Si intenta auto-generarse un nuevo humano, finaliza
+            if "### Human:" in ai_txt:
+                break
             tokens.append(next_token)
             ai_txt += char
+    # Limpieza final de etiquetas y caracteres de control
     output = ai_txt.split("###")[0].strip()
+    # Si el resultado es basura o está vacío (por el corte de seguridad)
+    if not output or len(output) < 2:
+        return "Estoy procesando la información... intenta preguntarme algo más específico."
     return output
+# --- INTERFAZ ---
 demo = gr.ChatInterface(
     fn=responder,
+    title="Mi IA Personal (Optimized)",
+    description="Modelo MiniGPT con filtros de repetición y sincronización de pesos activa.",
+    examples=["Hola", "¿Qué has aprendido?", "Cuéntame una historia"]
 )
 if __name__ == "__main__":