Leches33
/

AI

Text Generation

PyTorch

generic

Model card Files Files and versions

xet

Community

Leches33 commited on Feb 25

Commit

b45ba12

verified ·

1 Parent(s): 0207db0

Update handler.py

Browse files

Files changed (1) hide show

handler.py +4 -56

handler.py CHANGED Viewed

@@ -1,59 +1,7 @@
-from typing import Dict, List, Any
-import torch
-import torch.nn as nn
-import torch.nn.functional as F
-import os
-# Configuración idéntica a tu script
-embed_size = 256
-num_heads = 8
-num_layers = 4
-block_size = 256
-class MiniGPT(nn.Module):
-    def __init__(self, v_size=256):
-        super().__init__()
-        self.token_embedding = nn.Embedding(v_size, embed_size)
-        self.pos_embedding = nn.Embedding(block_size, embed_size)
-        self.blocks = nn.ModuleList([
-            nn.TransformerEncoderLayer(d_model=embed_size, nhead=num_heads,
-                                       dim_feedforward=embed_size*4, batch_first=True,
-                                       dropout=0.1, norm_first=True) for _ in range(num_layers)
-        ])
-        self.ln = nn.LayerNorm(embed_size)
-        self.fc_out = nn.Linear(embed_size, v_size)
-    def forward(self, idx):
-        T = idx.shape[1]
-        x = self.token_embedding(idx) + self.pos_embedding(torch.arange(T, device="cpu"))[None, :, :]
-        mask = torch.triu(torch.ones(T, T, device="cpu"), diagonal=1).bool()
-        for block in self.blocks: x = block(x, src_mask=mask)
-        return self.fc_out(self.ln(x))
 class EndpointHandler:
     def __init__(self, path=""):
-        self.model = MiniGPT()
-        # Buscamos el archivo de pesos
-        checkpoint_path = os.path.join(path, "pytorch_model.bin")
-        self.model.load_state_dict(torch.load(checkpoint_path, map_location="cpu"))
-        self.model.eval()
-    def __call__(self, data: Dict[str, Any]) -> List[Dict[str, Any]]:
-        inputs = data.get("inputs", "")
-        if not inputs: return [{"generated_text": ""}]
-        tokens = [ord(c) if ord(c) < 256 else 32 for c in inputs]
-        res = ""
-        for _ in range(30): # Generamos 30 caracteres para probar
-            idx = torch.tensor([tokens[-block_size:]])
-            with torch.no_grad():
-                logits = self.model(idx)
-            logits = logits[:, -1, :] / 0.7
-            probs = F.softmax(logits, dim=-1)
-            nxt = torch.multinomial(probs, 1).item()
-            if nxt == ord('\n'): break
-            tokens.append(nxt)
-            res += chr(nxt)
-        return [{"generated_text": res}]

 class EndpointHandler:
     def __init__(self, path=""):
+        # No cargamos nada para probar
+        pass
+    def __call__(self, data):
+        return [{"generated_text": "API FUNCIONANDO"}]